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Copyright (c) 1993 - 2004 Cornpugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



May 16, 2004, 06:47:29 ; Search time 8799 Seconds 

(without alignments) 
7873.651 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 



US-10-017-867A-281 
2320 

1 agggtcccttagccgggcgc. 



,tctctccccaacctcactaa 2320 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 27513289 seqs, 14931090276 residues 

Total number of hits satisfying chosen parameters: 55026578 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database : EST:* 

1: em_estba:* 

2: em_esthum: * 

3: em_estin:* 

4: em_estmu:* 

5: em_estov:* 

6: em_estpl:* 

7: em_estro:* 

8: em_htc:* 

9: gb_estl:* 

10: gb_est2:* 

11: gb_htc:* 

12: gb_est3:* 

13: gb_est4:* 

14: gb_est5:* 

15: em_estfun: + 
16: em_estom:* 
17: em_gss_hum:* 
1 8 : em_gs s_inv : * 
19: em_gss_pln : * 
20: em_gss_vrt:* 
21: em_gss_fun:* 
2 2 : em_g s s_mam : * 
2 3 : em_gss_mus : * 
24: em_gss_pro : * 
25: em__gss_rod: * 
26: em_gss_phg:* 
27: em_gss_vrl:* 



28: gb_gssl:* 
29: gb_gss2:* 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 

% 

Result Query 





No. 


Score 


Match Length 


DB 


ID 


Description 




1 


1180.4 


50. 9 


1182 


29 


AY404343 


AY404343 Homo sapi 




2 


912.2 


39. 3 


2197 


11 


AK050128 


AK050128 Mus muscu 




3 


857. 4 


37.0 


1180 


29 


AY404344 


AY404344 Pan trogl 




4 


853.2 


36.8 


879 


13 


BQ216829 


BQ21682 9 AG EN COURT 




5 


738 


31. 8 


916 


14 


CD050395 


CD0503 95 AGENCOURT 




6 


733. 8 


31.6 


1185 


29 


AY404345 


AY404345 Mus muscu 




7 


731. 6 


31.5 


1353 


11 


AK041045 


AK041045 Mus muscu 




8 


522.4 


22 . 5 


978 


12 


BI102968 


BI102968 602888578 




9 


488.6 


21. 1 


761 


12 


BI559553 


BI559553 603252894 


c 


10 


463.6 


20.0 


694 


10 


AW173071 


AW173071 xj82gll.x 


c 


11 


457.6 


19.7 


659 


14 


CB435346 


CB435346 615435 MA 




12 


452. 6 


19. 5 


1723 


11 


AK052644 


AK052644 Mus muscu 




13 


450 


19.4 


724 


14 


CB952493 


CB952493 AGENCOURT 




14 


444. 4 


19.2 


481 


14 


CB158774 


CB158774 K-EST0218 


c 


15 


442 


19. 1 


583 


9 


AI694348 


AI694348 wd45g04.x 


c 


16 


437 . 8 


18. 9 


462 


13 


BX109306 


BX109306 BX109306 


c 


17 


435. 8 


18 . 8 


439 


9 


AA633698 


AA633698 ag87all.s 




18 


431. 6 


18.6 


899 


12 


BI246549 


BI246549 602958449 


c 


19 


430 


18.5 


430 


9 


AI917116 


AI917116 ts52a02.x 


c 


20 


422 


18.2 


422 


9 


AI580389 


AI580389 tm42f08.x 


c 


21 


417 


18.0 


1055 


9 


AI654867 


AI654867 wb65cl2.x 




22 


415. 8 


17. 9 


660 


10 


BB221592 


BB221592 BB221592 


c 


23 


410.2 


17.7 


478 


9 


AI015041 


AI015041 ov51a05.s 




24 


406.4 


17.5 


901 


12 


BI827790 


BI827790 603075472 




25 


404 . 8 


17.4 


1021 


14 


CK231266 


CK231266 ILLUMIGEN 


c 


26 


400 


17.2 


543 


10 


AW236852 


AW236852 xm49hll.x 




27 


396.4 


17. 1 


721 


12 


BG972539 


BG972539 602841125 


c 


28 


393.4 


17. 0 


470 


9 


AA974327 


AA974327 oql0g06.s 




29 


389 


16. 8 


531 


28 


AQ386013 


AQ386013 RPCI11-14 


c 


30 


388.6 


16. 8 


449 


9 


AI217703 


AI217703 qhl5e09.x 




31 


387.8 


16.7 


738 


14 


CB954127 


CB954127 AGENCOURT 




32 


386.6 


16.7 


751 


28 


AQ748070 


AQ748070 HS 5538 A 




33 


384. 8 


16. 6 


886 


12 


BI101074 


BI101074 602886333 


c 


34 


384. 6 


16. 6 


454 


9 


AA970255 


AA970255 op64h06.s 




35 


384.4 


16. 6 


751 


14 


CB952810 


CB952810 AGENCOURT 


c 


36 


380. 4 


16.4 


580 


14 


CB423692 


CB423692 597208 MA 


c 


37 


376. 8 


16.2 


566 


14 


CB433850 


CB433850 610302 MA 




38 


375 


16.2 


460 


14 


R19994 


R19994 yg38h02.rl 




39 


374.2 


16. 1 


759 


12 


BG971626 


BG971626 602840706 




40 


372.4 


16. 1 


565 


12 


BI538734 


BI538734 434264 MA 




41 


370.4 


16. 0 


910 


12 


BI099853 


BI099853 602884666 




42 


368. 4 


15. 9 


763 


14 


CD241803 


CD2 41803 AGENCOURT 


c 


43 


364.6 


15.7 


619 


29 


CE584093 


CE584093 tigr-gss- 




44 


361.6 


15. 6 


1193 


12 


BI102573 


BI102573 602889579 


c 


45 


357 


15.4 


363 


14 


Z39483 


Z39483 HSC1BC022 n 



ALIGNMENTS 



RESULT 1 
AY404343 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 
ORIGIN 



AY404343 1182 bp DNA linear GSS 12-DEC-2003 

Homo sapiens HCM1859 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY404343 

AY4 04 343 .1 GI : 397 60320 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1182) 

Clark,A.G., Glanowski , S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J . J. , 
Adams,M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 1182) 

Clark,A.G., Glanowski , S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/ Qualifiers 

1. .1182 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
<1. .>1182 

/locus_tag="HCM1859" 



Query Match 50.9%; Score 1180.4; DB 29; Length 1182; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1181; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 458 AT G GAT T C C T T AAAGAAT GAGAAC T T C GAC AT G GT GAT AGT T GAAACT T T T GACT ACT GT 517 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 AT GGAT T C CT T AAAGAAT GAGAACT T C GACAT G GT GAT AGT T GAAACT T T T GACT ACT GT 60 

Qy 518 CCTTTCCTGATTGCTGAGAAGCTTGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTC 577 

I I I M I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 CCTTTCCTGATTGCTGAGAAGCTTGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTC 120 



Qy 578 GGCTCTTTGGAATTTGGGCTACCAATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTG 637 

I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 121 GGCTCTTTGGAATTTGGGCTACCAATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTG 18 0 

Qy 638 C T G AC T GAT C AC AT G G AC TTCTGGGGCC GAG T G AAG AAT T T T C T GAT G T T C T T TAG T T T C 697 

I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I II I I I I I II I I I M I I I I I I I I I I I I II 
Db 181 CTGACTGATCACATGGACTTCTGGGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTC 24 0 

Qy 698 T GCAGGAGGCAACAGCACAT GCAGT CT ACATT T GACAACACCAT CAAGGAACATTTCACA 757 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 T GCAGGAGGCAACAGCACAT GCAGT CTACATTT GACAACACCAT CAAGGAACATTTCACA 30 0 

Qy 758 GAAGGCTCTAGGCCAGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAAC 817 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I 

Db 301 GAAGGCTCTAGGCCAGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAAC 360 

Qy 818 TCTGACTTTGCCTTTGATTTTGCTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGC 877 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 361 TCTGACTTTGCCTTTGATTTTGCTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGC 420 

Qy 878 T T GAT GGAAAAAC C T ATT AAAC C AGT AC CACAAGAC T T GGAGAAC T T CAT T GC CAAGT T T 937 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 TT GAT GGAAAAAC CT AT T AAAC CAGT AC C ACAAGACT T GGAGAACT T CAT T G C CAAGTT T 4 80 

Qy 938 GGGGACTCTGGTTTTGTCCTTGTGACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCG 997 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I 
Db 481 GGGGACTCTGGTTTTGTCCTTGTGACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCG 54 0 

Qy 998 GAAAT C T T C AAG GAG AT GAAC AAT GCCTTTGCT C AC C T AC C C C AAG G G GT GAT AT G GAAG 1057 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 
Db 541 GAAAT C T T C AAG GAG AT GAAC AAT GCCTTTGCT C AC C T AC C C C AAG G G GT GAT AT G GAAG 600 

Qy 1058 T GT CAGT GT T C T CAT T G G C C C AAAG AT GT C C AC C T G G C T G C AAAT G T G AAAAT T GT G G AC 1117 

M I I I I I I I II I I I I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 TGTCAGTGTTCTCATTGGCCCAAAGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGAC 660 

Qy 1118 TGGCTTCCTCAGAGTGACCTCCTGGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGC 117 7 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 661 TGGCTTCCTCAGAGTGACCTCCTGGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGC 720 

Qy 117 8 GG GC AGAAT AG CATAAT GGAGGC C AT C CAGC AT GGT GT GC C CAT GGT GGGGAT C C C T C T C 12 37 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GG GC AGAAT AGC AT AAT G GAG G C CAT C CAG CAT GGT GT GC C CAT G GT G G G GAT C C CT CT C 7 80 

Qy 1238 T T T GGAGAC CAGC CT GAAAACAT GGT C C GAGT AGAAGC CAAAAAGTT T GGT GTT T CT AT T 12 97 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I 
Db 781 T T T G GAGAC CAGC CT GAAAACAT G GT C CGAGT AGAAG C CAAAAAGT T TGGTGTTT CT AT T 84 0 

Qy 1298 CAGT T AAAG AAG CT C AAG G C AGAGAC AT T G G CT CT T AAGAT GAAACAAAT CAT G GAAGAC 1357 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 841 CAGTTAAAGAAGCT CAAGGCAGAGACATT GGCTCTTAAGAT GAAACAAAT CAT GGAAGAC 900 

Qy 1358 AAGAGATACAAGTCCGCGGCAGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGC 1417 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I I I I I I I I I I I I 
Db 901 AAGAGATACAAGTCCGCGGCAGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGC 960 

Qy 1418 CCCACACAGCGGCTGGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCAC 14 77 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 961 CCCACACAGCGGCTGGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCAC 102 0 

Qy 147 8 CTCAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTG 1537 

II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M 
Db 1021 CTCAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAGCAGTACCTGCTCGACGTTTTTGTG 108 0 

Qy 1538 TTTCTGCTGGGGCTCACTCTGGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCT 1597 

I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 TTTCTGCTGGGGCTCACTCTGGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCT 114 0 

Qy 1598 GTCTGGTGGCTGCGTGGGGCCAGAAAGGTGAAGGAGACATAA 1639 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I I I 

Db 1141 GTCTGGTGGCTGCGTGGGGCCAGAAAGGTGAAGGAGACATAA 1182 



RESULT 2 
AK050128 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 



AK050128 2197 bp mRNA linear HTC 20-SEP-2003 

Mus musculus adult male liver tumor cDNA, RIKEN full-length 
enriched library, clone : C730018P11 product : hypothetical 
UDP-glucoronosyl and UDP-glucosyl transferase containing protein, 
full insert sequence. 
AK050128 

AK050128. 1 GI: 2 634 0835 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci,P. and Hayashizaki, Y . 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 
Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 
Normalization and subtraction of cap-trapper-selected cDNAs to 
prepare full-length cDNA libraries for rapid discovery of new genes 



Genome Res 
20499374 
11042159 
3 

Shibata, K. 



10 (10), 1617-1630 (2000) 



Itoh,M. 



Aizawa, K. , 
Konno,H., Akiyama,J., Nishi,K., 
Sumi,N., Ishii,Y., Nakamura,S., 



Carninci , P . 
, Itoh,M., 
Harada,A. , 



Nagaoka,S., Sasaki, N., 
Kitsunai, T . , Tashiro,H. 
Hazama,M., Nishine,T. 
Yamamoto,R., Matsumoto, H. , Sakaguchi , S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu, M. , Inoue,Y., Kira,A. and Hayashizaki , Y . 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 



REFERENCE 4 

AUTHORS The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

TITLE Functional annotation of a full-length mouse cDNA collection 

JOURNAL Nature 409, 685-690 (2001) 
REFERENCE 5 

AUTHORS The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

TITLE Analysis of the mouse transcriptome based on functional annotation 

of 60,770 full-length cDNAs 

JOURNAL Nature 420, 563-573 (2002) 
REFERENCE 6 (bases 1 to 2197) 

AUTHORS Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M. , Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M. , Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M. , 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura^., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H. , Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M. , Tagawa,A., Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A. , Toya,T., Yasunishi,A. , 
Muramatsu,M. and Hayashizaki, Y. 

TITLE Direct Submission 

JOURNAL Submitted ( 16- JUL-2001 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res @gsc . riken. go . jp, 
URL :http: //genome . gsc. riken. go . jp/, Tel : 81-45-503-9222, 
Fax: 81-45-503-9216) 
COMMENT cDNA library was prepared and sequenced in Mouse Genome 

Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Tissue was provided by William A. Held, Roswell Park Cancer 
Institute, Department of Molecular and Cellular Biology, Elm and 
Carlton Streets, Buffalo, NY 14263, whose assistance we gratefully 
acknowledge . 

Please visit our web site for further details. 
URL : http : //genome . gsc . riken . go . jp/ 
URL: http : / /f antom. gsc . riken . go . jp/ . 
FEATURES Location/Qualifiers 
source 1. .2197 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain= M C57BL/6J" 

/db_xref="FANTOM_DB:C730018Pll" 

/db_xref="MGI : 2417843" 

/db_xref="taxon: 10090" 

/clone= M C730018Pll" 

/sex="male" 

/ cell_type=" tumor " 

/ tissue__type= "liver" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 



/dev_stage= "adult" 
CDS 99. .1670 

/note="unnamed protein product; hypothetical 

UDP-glucoronosyl and UDP-glucosyl transferase containing 

protein ( InterPro | IPR0022 13, evidence: InterPro) 

putative" 

/codon_start=l 

/protein_id="BAC3408 0. 1" 

/db_xref ="GI : 26340836" 

/ trans la tion="MAAHRRWLLMSFLFLEVILLEAAKILTISTLSASHYIVISRVSQ 
VLHEGGHNVTKLLYESANIPDFRKEKPSYQVINWRPPEDQEKKFADLRHRLTEEITYG 
RSKHHTLLKIHQYFGDLCSQLLSRKDIMDFLKNENFDLVLLDSMDLCSLLIVEKLGKR 
FVSFLPFQFSYMDFGLPSAPLSYAPVYGSGLTDQMDFWGRVKNFLMFLDFSMKQREIL 
SQYDSTIQEHFVEGSQPVLSDLLLKAELWFVNSDFALDFARPLFPNTVYVGGLLDKPV 
QPIPQDLENFISQFGDSGFVLVALGSIVSMIQSKEIIKEMNSAFAHLPQGVLWTCKTS 
HWPKDVSLAPNVKIMDWLPQTDLLAHPSIRLFWHGGMNSVMEAVHHGVPMVGIPFFF 
DQPENMVRVEAKNLGVSIQLQTLKAESFALTMKKIIEDKRYKSAAMASKIIRHSHPLT 
PAQRLLGWIDHILQTGGAAHLKPYAFQQPWHEQYMLDVFLFLLGLMLGTLWLSVKVLV 
AVTRYL S I AT KVKEA" 

polyA_signal 2178. .2183 

/ note="putative" 

polyA_site 2197 

/ not e= "putative" 

ORIGIN 

Query Match 39.3%; Score 912.2; DB 11; Length 2197; 

Best Local Similarity 73.0%; Pred. No. 3.8e-248; 

Matches 1201; Conservative 0; Mismatches 438; Indels 6; Gaps 2; 
Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

MINIMUM I I I I III I I I I I I I I I 

Db 32 AGGGTCCCTTAGTGGGGCACAGCTCTTTAGGTGTGCAACCTGTGTCAGGGCTCCACATAT 91 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I II I II I I I II I I I I I II I II I II I I I I I M M I I 

Db 92 TCTACAGATGGCAGCACATCGGCGTTGGCTTCTCATGAGCTTCCTTTTCCTTGAGGTTAT 151 

Qy 121 GCT CT CAGAGGCT GCCAAAATCCT GACAATAT CTACAGT AGGT GGAAGC C ATT AT CTACT 18 0 

MM I M I I M I II I I II M I I I I II I II M I I I II I I I I II M I I II I 

Db 152 T CT CTT GGAGGCT GCAAAAATCCT GACTAT AT CTACACT GAGT GCAAGC CATTAT AT AGT 211 

Qy 181 GAT G GAC CGGGTTTCT C AGAT T C T T C AAG AT C AC G G T C AT AAT G T C AC CAT GCT T AAC C A 240 

II I II I II I I I I I I II I I I II I I I I I I I M I II I III I 

Db 212 GATAAGCCGTGTGTCGCAAGTTCTTCATGAAGGTGGCCACAATGTGACCAAACTTCTTTA 271 

Qy 241 C AAAAGAG GT C C T T T TAT GC C AGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT T AT C AG 30 0 

M I II II III II I I I I I I I I I II I II I II II II I I I I I II II I I I 
Db 272 TGAAA GT GC T AAT AT C C C AGAT T T T AGAAAG GAAAAAC CAT CAT AT CAAGT T AT T AA 328 

Qy 301 TTGGCTTG CAC CT GAAGAT CAT CAAAGAGAAT T T AAAAAGAGT T T T GAT TTCTTTCTG GA 360 

I II I I I I I I I I I I I I I I I I II I I I I I I I I || M II 

Db 329 TTGGCGTC CAC C T GAAGAT C AG G AAAAG AAAT T T G C T GAT C T TAG G CAT C GAC T T AC AG A 388 

Qy 361 AG AAAC T T TAG GT G G C AGAG GAAAAT T T GAAAAC T TAT T AAAT GT T C T AGAAT AC T T G G C 42 0 

II M I M M II III I I I I I MM II II I II I I I 

Db 38 9 AGAAAT AAC T T AT GGC AG GT C CAAAC AT CAC AC C CT T C T AAAGAT C CAT CAAT AC T T T GG 448 



Qy 421 GT T GC AGT GC AGT CAT T T T T T AAAT AGAAAGGAT AT CAT G GAT T C CTT AAAGAAT GAGAA 4 80 

i ii 1 1 1 1 1 1 n I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 44 9 GGACTTAT GCAGTCAATTATTAAGCAGAAAGGACAT CAT GGACTT CTTAAAAAAT GAGAA 5 08 

Qy 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I I I I I I I I MM I III I II I M II I I I I M I I I M I I I 

Db 509 CTTTGACCTAGTACTTCTTGATTCAATGGATCTCTGTTCTTTGCTAATTGTTGAAAAGCT 5 68 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

II I I I I I I I M I I I I I I I I II I I I Ml II I I I II I I II I I I II I I 

Db 569 TGGGAAACGATTTGTGTCCTTTCTTCCCTTTCAATTTAGCTATATGGACTTTGGGTTACC 62 8 

Qy 601 AA TCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTT 657 

II I I I I M II I I I II II II II I I I I I I I I II I I I I II I | | | M 

Db 62 9 AAGCGCCCCCTTGTCCTATGCTCCAGTGTATGGTTCTGGTCTAACTGACCAAATGGACTT 68 8 

Qy 658 CT GGGGC CGAGT GAAGAATTTTCT GAT GTT CT TTAGT TT CT GCAGGAGGCAACAGCACAT 717 

M I I II II I I I I II I II I I I I I I I I I II II II I I I I I II II MM I I M 
Db 68 9 CTGGGGCC GAGT GAAGAACT T T CT GAT GT T CCT T GAT T T CT CC AT GAAGCAAAG G GAAAT 748 

Qy 718 GC AGT CT AC AT T T GACAAC AC CAT CAAG GAAC AT T T CAC AGAAGG C T C T AGGC C AGT T T T 777 

I I I I I II I II I I I I I I II II I I I I I I II II I I II II 1 I || || 

Db 749 C C T T T CT C AGT AT GACAG CAC TAT C C AGGAGC AT TT T GT GGAAG GCT CT C AG C C AGT GT T 808 

Qy 77 8 GTCTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTT 837 

I I M I II II II I 1 II II I I I II I II I I II I I M I II II I I II II II I I I I I 
Db 809 GTCTGACCTTCTACTGAAAGCTGAGCTGTGGTTTGTCAACTCTGACTTTGCTTTGGATTT 8 68 

Qy 838 T GCT C GAC CT CT GCTT C C CAAC ACT GT TT AT GT T GGAG GCT T GAT GGAAAAAC CT AT T AA 8 97 

I I I II I II Ml I I I I I I II II II Mill I I II I II MM I II II I II I 
Db 869 TGCTCGTCCCCTGTTTCCCAACACAGTCTATGTGGGAGGTTTACTGGACAAACCTGTTCA 92 8 

Qy 89 8 AC C AGT AC C AC AAG AC T T G G AG AAC T T CAT T G C C AAGT T T G G G GAC TCTGGTTTTGTCCT 957 

M I I M I I II I I II I I I I I I I II II I I M I II I Mill I I II M 

Db 92 9 G C CAAT AC C C CAAGACTT GGAGAAT T T TAT CT CT CAGT T T GGAGAC T C AGGT TT T GT C C T 988 

Qy 958 TGTGACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGAGATGAA 1017 

I I I I M I II I I I I II I I I I II I II I MUM I I I I I I II I II I 

Db 98 9 TGT GGCC CT GGGCT CT ATAGT GAGCAT GAT T CAGT C CAAG GAAAT TAT TAAGGAGAT GAA 104 8 

Qy 1018 CAATGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCC 1077 

M I I I II II I II I I II I II I II I II I II I I I I I I III II I I II II I II 1 I I 
Db 104 9 CAGTGCCTTTGCTCACCTCCCTCAAGGGGTGCTATGGACATGTAAGACTTCTCATTGGCC 1108 

Qy 1078 CAAAGAT GT C C AC CT G GC T GCAAAT GT GAAAAT T GT GGACT GGCT T CCT C AGAGT GAC C T 1137 

II I I I II II I I II I I I I II I I I I I II MM I II II II I MM I II I I I 

Db 1109 CAAAGAT GT CAGT T T GGC C C CAAAT GT CAAAAT CAT GGAT T GG CT T C CAC AGAC T GAC C T 1168 

Qy 1138 CCTGGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGA 1197 

II I II I I I M I I II I I I I I I II I I II I I I II II II I III II I II I II 

Db 1169 T CT AG C T CAC C CT AGCAT T C GT C T GTT T GT C ACT CAT G GAGGGAT GAAC AGT GT GAT G GA 122 8 

Qy 1198 GGCCATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAA 12 57 

Ml I I II II I II II M I II I I II I II II I I MM I II I I I I I I I I I I 
Db 122 9 GGCT GT C CAT CAT GGAGT AC C CAT GGT GGGGAT T CCATT T T TT TTTGACCAACCT GAAAA 12 8 8 

Qy 1258 CATGGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGC 1317 



1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II III 1 1 1 1 1 1 1 1 1 

Db 12 8 9 CAT G G T C C G AGT AG AAG C AAAGAAC CTTGGTGTTTC TAT T C AG C T AC AG AC G CT C AAG G C 134 8 

Qy 1318 AGAG AC AT T G G C T C T T AAG AT G AAAC AAAT CAT G GAAGAC AAG AG AT AC AAG T C C G C G G C 1377 

I I I I I I I I II II I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I II II 
Db 1349 AGAGT CAT T T G C GC T C AC CAT GAAAAAAAT C AT AGAAGAC AAGAGGT ACAAGT C T GC AG C 1408 

Qy 137 8 AGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGG 1437 

I I I I I III I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I 
Db 1409 AATGGCCTCCAAGATTATCAGGCACTCCCACCCACTGACCCCTGCCCAGAGGCTTTTGGG 1468 

Qy 1438 CTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCA 14 97 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MM 

Db 14 69 CT GGAT AGAT CAT AT C T T G CAGAC AG GGGGT GCAG CAC AT C T C AAG C CAT AT GCT T T C C A 152 8 

Qy 1498 GCAGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCT 1557 

II II II II I II I I I M M M I I I I I I M I I I I I II I II II I II II II 

Db 152 9 GCAGCCATGGCATGAGCAGTACATGCTTGATGTCTTCCTCTTTCTCCTAGGGCTCATGCT 1588 

Qy 1558 GGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGC 1617 

I I I II I I I I I II I I I I I I I I II I I I I II Mill II 

Db 158 9 GGGTACTTTGTGGCTTAGTGTAAAGGTTCTTGTTGCTGTAACCAGGTATCTGAGTATAGC 164 8 

Qy 1618 CAGAAAGGT GAAGGAGACATAAGGC 1642 

I II I I I I I I I II I I II I II 
Db 164 9 AACGAAGGTCAAGGAGGCATAATGC 1673 
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Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Pan. 



AY404344 1180 bp DNA linear GSS 12-DEC-2003 

Pan troglodytes HCM1859 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY404344 

AY404344. 1 GI: 397 60321 
GSS. 

Pan troglodytes (chimpanzee) 
Pan troglodytes 
Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 1180) 

Clark, A. G. , Glanowski, S . , Nielson,R., Thomas , P . , Kej ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J . , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 1180) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2 003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 



COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualifiers 
source 1. .1180 

/organism="Pan troglodytes" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9598" 
gene <1. .>1180 

/locus_tag="HCM1859 n 

ORIGIN 

Query Match 37.0%; Score 857.4; DB 29; Length 1180; 

Best Local Similarity 73.0%; Pred. No. 1.3e-232; 

Matches 861; Conservative 0; Mismatches 319; Indels 0; Gaps 0; 

Qy 4 60 GGAT T C C TT AAAGAAT GAGAACT T C GAC AT GGT GAT AGT T GAAACT T T T GAC T ACT GT C C 519 

I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 1 G GAT T C C T T AAAGAAT GAG AAC T T C GAC AT GGT GAT AG T T G AAAC T T T T G AC T AC T G T C C 60 

Qy 52 0 TTTCCTGATTGCTGAGAAGCTTGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGG 579 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 61 TTTCCTGATTGCTGAGAAGCTTGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGG 120 

Qy 58 0 CTCTTTGGAATTTGGGCTACCAATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCT 639 

I II I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 121 CTCTTTGGAATTTGGGCTACCAATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCT 180 

Qy 64 0 GACT GAT CAC AT G GACTT CT G GGGC C GAGT GAAGAAT T T T CT GAT GT T CT TT AGT T T CT G 699 

I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I 
Db 181 GACTGATCACATGGACTTCTGGGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTG 24 0 

Qy 7 00 C AGGAGGCAAC AG C ACAT GC AGT CT AC AT T T GACAAC AC CAT CAAGGAAC AT T T C AC AGA 7 59 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I 
Db 241 CAGGAGGCAAT GGGACATGCAGT CTACATTTGACAACACCATCAAGGAGCATTT CCCAGA 300 

Qy 7 60 AGGCTCTAGGCCAGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTC 819 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 AGGCTCTAGGCCAGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTNNNTTAACTC 360 

Qy 82 0 TGACTTTGCCTTTGATTTTGCTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTT 87 9 

II I I I I I I I I I I I I I I I 

Db 361 TGNNNTTGCCTTTGATTTTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 42 0 

Qy 88 0 GAT G GAAAAAC CT AT T AAAC C AGT AC C ACAAGACTT GGAGAACTT CAT T GC CAAGTT T G G 939 

Db 421 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 480 

Qy 940 GGACTCTGGTTTTGTCCTTGTGACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGA 999 

Db 4 81 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 54 0 

Qy 1000 AAT C T T C AAGGAGAT GAACAAT GCCTTTGCT CAC CT AC C C CAAGG GGT GAT AT G GAAGT G 1059 

Db 541 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 60 0 



Qy 1060 TCAGTGTTCTCATTGGCCCAAAGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTG 1119 



Db 



601 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 660 



Qy 112 0 GCTTCCTCAGAGTGACCTCCTGGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGG 117 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 NNNNNNNNNNNNNNNNNNNNNNNCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGG 720 

Qy 118 0 GC AGAAT AGC AT AAT G GAG G C CAT C CAGCAT GGT GT G C C CAT G GT GGG GAT CCCTCTCTT 123 9 

I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 G CAGAAT AG CAT AAT GGAGGC C AT C C AG CAT GGTGTGCC CAT GGT GGG GAT CCCTCTCTT 780 

Qy 124 0 T G GAGAC C AGC CT GAAAACAT GGT C C GAGT AGAAGC CAAAAAGTT T GGT GT T T CT AT T C A 1299 

I I I I I I II I I I I I I I II I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 781 TGGAGACCAGCCTGAAAACATGGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCA 84 0 

Qy 1300 GT T AAAGAAG CT C AAG GC AGAGAC ATT GG C T CT TAAGAT GAAACAAAT CAT GGAAGACAA 1359 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 GT TAAAGAAG C T CAAGGC AGAGAC AT T G GC T C TT AAGAT GAAACAAAT CAT G GAAGAC AA 9 00 

Qy 1360 GAGATACAAGTCCGCGGCAGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCC 1419 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I II I I II I II I I II I I I I INN 
Db 901 GAGATACAAGTCCGCGGCAGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCNNNNAGCCC 960 

Qy 1420 CACACAGCGGCTGGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCT 1479 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CACACAGCGGCTGGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCT 1020 

Qy 14 8 0 CAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTT 1539 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I II I I 
Db 1021 CAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAGCAGTACCTGCTCGACGTTTTTGTGTT 1080 

Qy 1540 TCTGCTGGGGCTCACTCTGGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGT 1599 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I || I 

Db 1081 TCTGCTGGGGCTCACTCTGGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGT 114 0 

Qy 1600 CT GGT GGCT GC GT GGGGCCAGAAAGGT GAAGGAGACAT AA 1639 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1141 CTGGTGGCTGCGT GG G GC CAG AAAG GT GAAGGAGAC ATAA 118 0 
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BQ216829 879 bp mRNA linear EST 02-MAY-2002 

AGENCOURT_7594754 NIH_MGC_92 Homo sapiens cDNA clone IMAGE : 6043558 
5 T , mRNA sequence. 
BQ216829 

BQ216829. 1 GI:20398229 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 879) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 
Email : cgapbs-r @mail . nih . gov 



Crania ta ; Vertebrata ; Euteleos tomi ; 
Catarrhini; Hominidae; Homo. 



Tissue Procurement: ATCC 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC cl one distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : / / image . llnl . gov 
Plate: LLAM13284 row: 1 column: 23 
High quality sequence start: 17 
High quality sequence stop: 671. 
FEATURES Location/Qualifiers 
source 1. .879 

/organism= M Homo sapiens" 
/mol_type="mRNA" 
/db__xref="taxon: 9606" 
/clone=" IMAGE: 6043558" 

/tissue_type="embryonal carcinoma, cell line" 
/lab_host="DH10B (phage-resistant ) " 
/clone_lib="NIH_MGC_92" 

/note="Organ: testis; Vector: pCMV-SPORT6; Site_l: NotI; 
Site_2: Sail; Cloned unidirectionally; oligo-dT primed. 
Average insert size 2.5 kb. Library enriched for 
full-length clones and constructed by Life Technologies. 
Note: this is a NIH_MGC Library." 

ORIGIN 

Query Match 36.8%; Score 853.2; DB 13; Length 879; 

Best Local Similarity 99.0%; Pred. No. 1.8e-231; 

Matches 869; Conservative 0; Mismatches 8; Indels 1; Gaps 1; 

CTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTG 83 9 

I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i | | | | | | | | | | 

CT CAT CT T CT AC T GAAAGC AGAGAT GT GGT T CAT T AAC T CT GACT T T GC CT T T GAT T T T G 60 

CTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAAC 8 99 
I I I I I I I I I I I II I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | I I I I I I I 
CTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAAC 12 0 

CAGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTG 959 
I I I I M I I I I I I I I I I I II I I I I I I I I I II II I I I I I I II I I I I I I II I II I I I I I I I I I 
CAGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTG 18 0 

T GAC CTT GGGCT C CAT GGT GAACACCT GT CAGAAT C C GGAAAT CT T CAAGGAGAT GAACA 1019 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GAC CTTGGGCTC CAT GGT GAAC AC C T GT CAGAAT C C G GAAAT CTT C AAG GAG AT GAACA 240 

ATGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCA 1079 
I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCA 300 

AAGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCC 1139 
M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | I I I I I 
AAGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCC 360 

T GGC T C AC C CAAG CAT CCGTCTGTTTGT C AC C C AC G GC GG G CAGAATAGC AT AAT GG AG G 1199 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

TGGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGG 42 0 



Qy 


780 


Db 


1 


Qy 


840 


Db 


61 


Qy 


900 


Db 


121 


Qy 


960 


Db 


181 


Qy 


1020 


Db 


241 


Qy 


1080 


Db 


301 


Qy 


1140 


Db 


361 



Qy 1200 CCATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACA 1259 

I I I I I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I | I I I 
Db 421 CCATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACA 4 80 

Qy 1260 T GGT C C GAGT AG AAG C C AAAAAGT TTGGTGTTTC TAT T C AGT T AAAGAAG C T C AAGGC AG 1319 

M I I I I I I I I I I II I I || I I I I || I I I I || | M I I I I II II I I II I I I I I I I I I II I I I I 
Db 481 TGGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAG 540 

Qy 132 0 AG AC AT T G G C T C T T AAG AT G AAAC AAAT CAT G G AAG AC AAG AG AT AC AAG T C C G C G G C AG 1379 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I | | | | | | | 
Db 541 AGAC AT T G G C T C T T AAG AT GAAAC AAAT CAT G GAAGAC AAGAG AT AC AAGT C C G C G G C AG 600 

Qy 138 0 TGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCT 14 3 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I | | | | | 

Db 601 TGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCT 660 

Qy 144 0 GGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGC 1499 

I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 
Db 661 GGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGC 72 0 

Qy 1500 AGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGG 1559 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AGCCCTGGCATGAGCAGTACCTGCTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGG 7 80 

Qy 1560 GGACTCTATGGCTTTGT-GGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCC 1618 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 781 GGACTCTATGGCTTTGTGGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCTTGGGGCC 84 0 

Qy 1619 AGAAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTG 1656 

I I I I II I II I I II I I III I I I I I I I I I I Mill 
Db 841 ACAAAG GGGAAG GAGAC C T AAAG C C AG GT GC AC C CT T G 878 
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Crania ta; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



CD050395 916 bp mRNA linear EST 09-MAY-2003 

AGENCOURT_13977 999 NIH_MGC_173 Homo sapiens cDNA 5*, mRNA sequence. 
CD050395 

CD050395.1 GI:30487290 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 916) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 
Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Dr. Jamie Thompson, University of WI 
cDNA Library Preparation: Gina Zas trow-Hayes 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/ LLNL at: 



http: //image. llnl . gov 
Plate: NDKM37 row: m column: 04 
High quality sequence start: 12 
High quality sequence stop: 721. 
FEATURES Location/Qualifiers 
source 1. .916 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 

/tissue_type="embryonic trophoblasts, made from WA01 stem 
cells" 

/lab_host="DHlOB TonA" 
/clone_lib="NIH_MGC_173" 

/note="Vector : pDONR2 01; Site_l: attP2; Site_2: attPl; 
LIBR_PRIMING - oligo dT; METHOD - full-length enriched; 
LIBR PROVIDER - Bradfield" 

ORIGIN 

Query Match 31.8%; Score 738; DB 14; Length 916; 

Best Local Similarity 95.0%; Pred. No. 1.4e-198; 

Matches 795; Conservative 0; Mismatches 36; Indels 6; Gaps 3; 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 1 I I I I I I 
Db 54 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 113 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 114 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 173 

Qy 121 G CT C T C AGAG G C T GC CAAAAT C C T GAC AAT AT CT ACAGT AGGT GGAAG C CAT TAT C T AC T 18 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I 

Db 174 GC T CT CAGAG GCT G C CAAAAT C C T GACAAT AT C T AC AGT AGGT G GAAGC C AT TAT CT ACT 233 

Qy 181 GAT G GAC CGGGTTTCT C AGAT T C T T C AAG AT C AC G GT CAT AAT GT C AC CAT GCT T AAC C A 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 234 GAT GGAC CGGGTTT CT CAGAT T CTT CAAGATCACGGT CAT AAT GTCACCAT GCT TAACCA 2 93 

Qy 241 CAAAAGAGGT C CT T T TAT GC CAGAT TT TAAAAAGGAAGAAAAAT CAT AT CAAGT T AT C AG 300 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I II I I I I I 
Db 2 94 CAAAAGAGGT C CT TT TAT GC CAGAT T T TAAAAAGGAAGAAAAAT CAT AT CAAGT TAT C AG 353 

Qy 301 TT GGCTT GCACCT GAAGATC AT CAAAGAGAAT TTAAAAAGAGT TTT GAT TT CT TTCT GGA 360 

I I I I II I I I I I I II I M I II I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I 

Db 354 TTGGCTTG C AC C T GAAG AT CAT CAAAGAGAAT T T AAAAA G AGT TTT GAT TTCTTTCTG G A 413 

Qy 3 61 AGAAAC T T TAG GT GGC AGAGGAAAAT T T GAAAACT T ATTAAAT GT T CT AGAATAC T T G GC 42 0 

I I I I I I I I I I I M I I I I I I I M I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I 

Db 414 AGAAAC T T TAG GT G G CAGAG GAAAAT T T GAAAAC T TAT T AAAT G T T C TAG AAT AC T T G G C 4 73 

Qy 421 GT T G C AGT GC AGT CAT T T T T T AAAT AGAAAGGAT AT CAT G GAT T C C T T AAAGAAT GAGAA 480 

I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I II I I I I I 

Db 474 GTT GCAGT GCAGTCATTTTTTAAATAGAAAGGATAT CAT GGATTC CTT AAAGAAT GAGAA 533 

Qy 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 534 CTT CGACAT- GTGAT AGTT GAAACT TT T GACTACT GT CCTT T C CTGAT T GCT GAGAAGCT 592 



Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I II I I I I II I I I I I I I II I I I I 
Db 593 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 652 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I M II I I II I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I | | | | | | I 
Db 653 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 712 

Qy 661 GGG C C GAG T GAAGAAT T T T C T GAT GT T CT T TAG T T T C T G C AG GAG G C AAC AG C AC AT G C A 72 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I II I I I 
Db 713 GGGC C GAGT GAAGAAT T TT CT GATN GT CT TT AGT T T CT G CAG GAAGC AACAG C AC AT GC A 772 

Qy 721 GT C T AC AT T T GAC AAC AC CAT C AAG GAAC A — T T T C AC AG AAG G C T C TAG G C CAG T T T T G 77 8 

I I I I I I I I I I I I I I I II I I I I I I I III I I I I I I I I I I I I I I I I I I I III 
Db 773 GT C T AC AT T T GAC AAC AC CAT C C AAG GAC AT T T T T C AC AG AG G G C T C T AG G G C CAG T T T T 832 

Qy 779 TCTC ATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTT 832 

I I I I I I I I I I I I II I I I I I I I I I I I I I I || 

Db 833 GTCCTCAATCTTCTACTGAAAAGCAAAAGTTGGTGGGTTCATTTAACCTCTGGACTT 88 9 
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AY404345 1185 bp DNA linear GSS 12-DEC-2003 

Mus musculus HCM1859 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY404345 

AY404345. 1 GI: 397 60322 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 

1 (bases 1 to 1185) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal , A. , 
Todd, M. A. , Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B . , 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 1185) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P. 



Kej ariwal, A. , 

Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .1185 

/organism="Mus musculus" 
/mol_type= ,, genomic DNA" 



/db_xref="taxon: 10090" 
gene <1. .>1185 

/ 1 o cu s_t ag= " HCMl 859" 

ORIGIN 

Query Match 31.6%; Score 733.8; DB 29; Length 1185; 

Best Local Similarity 76.8%; Pred. No. 2.4e-197; 

Matches 910; Conservative 0; Mismatches 272; Indels 3; Gaps 1; 

Qy 458 AT GGATT CCTT AAAGAAT GAGAACT T CGACAT GGT GAT AGTT GAAACTT T T GACT ACT GT 517 

I I I I ! I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I 
Db 1 AT G GAC T T C TT AAAAAAT GAGAACT T T GAC C T AGT ACT T CT T GAT T CAAT G GAT C T C T GT 60 

Qy 518 CCTTTCCTGATTGCTGAGAAGCTTGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTC 57 7 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 61 TCTTTGCTAATTGTTGAAAAGCTTGGGAAACGATTTGTGTCCTTTCTTCCCTTTCAATTT 120 

Qy 57 8 GGCTCTTTGGAATTTGGGCTACCAA TCCCCTTGTCTTATGTTCCAGTATTCCGTTCC 634 

IN I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 AGCTATATGGACTTTGGGTTACCAAGCGCCCCCTTGTCCTATGCTCCAGTGTATGGTTCT 180 

Qy 635 TT GC T GACT GAT C AC AT G GAC TTCTGGGGCC GAGT GAAGAATT TT C T GAT GT T CT T T AGT 694 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 181 GGTCTAACTGACCAAATGGACTTCTGGGGCCGAGTGAAGAACTTTCTGATGTTCCTTGAT 24 0 

Qy 695 TT CT GCAGGAGGCAACAGC AC AT GCAGT CTAC ATTT GACAACAC CAT CAAGGAACAT TT C 754 

I I I I I I I I I I I I I I I I I III I I I I I I I I I I II I I I I I I I I I 
Db 241 TT CT C CAT GAAGCAAAGGGAAAT C CTT T CT C AGT AT GAC AGC ACT AT C C AGGAGC AT T T T 30 0 

Qy 755 ACAGAAGGCTCTAGGCCAGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATT 814 

I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I III I I I I I I I I 
Db 301 GTGGAAGGCTCTCAGCCAGTGTTGTCTGACCTTCTACTGAAAGCTGAGCTGTGGTTTGTC 360 

Qy 815 AACTCTGACTTTGCCTTTGATTTTGCTCGACCTCTGCTTCCCAACACTGTTTATGTTGGA 874 

I I I M I I I I I I I I I II I I I I I I I I I I I II Ml I I I I I I | | I | || I I II I III 
Db 361 AACTCTGACTTTGCTTTGGATTTTGCTCGTCCCCTGTTTCCCAACACAGTCTATGTGGGA 42 0 

Qy 875 GG CT T GAT GGAAAAAC CT AT T AAAC C AGT AC C ACAAGAC T T GGAGAACT T CAT T GC CAAG 934 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 421 GGTT T AC T GGAC AAAC CT GT T C AG C CAAT AC C C C AAGACT T GGAGAAT T T T AT CT CT C AG 48 0 

Qy 935 TTTGGGGACTCTGGTTTTGTCCTTGTGACCTTGGGCTCCATGGTGAACACCTGTCAGAAT 994 

I I I I I I I I I I I I II I I I I I I I I I II II I I I I I I I II I I I I II I I I I 

Db 4 81 TTTGGAGACTCAGGTTTTGTCCTTGTGGCCCTGGGCTCTATAGTGAGCATGATTCAGTCC 54 0 

Qy 995 C C G G AAAT CTT CAAG GAG AT G AAC AAT GCCTTTGCT C AC C T AC C C CAAG G G G T GAT AT G G 1054 

I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I II II II I I I I I I I I I I 
Db 541 AAG G AAAT TAT T AAG GAG AT G AAC AGT GCCTTTGCT C AC C T C C C T CAAG G G GT G C TAT G G 60 0 

Qy 1055 AAGTGTCAGTGTTCTCATTGGCCCAAAGATGTCCACCTGGCTGCAAATGTGAAAATTGTG 1114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 601 ACAT GTAAGACTT CT CAT T G GC CCAAAG AT GT CAGT TT GGC C C CAAAT GT CAAAAT CAT G 660 

Qy 1115 GACTGGCTTCCTCAGAGTGACCTCCTGGCTCACCCAAGCATCCGTCTGTTTGTCACCCAC 1174 

II I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 661 GATTGGCTTCCACAGACTGACCTTCTAGCTCACCCTAGCATTCGTCTGTTTGTCACTCAT 720 



Qy 1175 GGCGGGCAGAATAGCATAATGGAGGCCATCCAGCATGGTGTGCCCATGGTGGGGATCCCT 1234 

II III M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M 

Db 721 GGAGG GAT GAACAGT GT GAT G GAGG CT GT C CAT CAT G GAGT AC C CAT G GT GGGG AT T C C A 7 80 



Qy 


1235 


CTCTTTGGAGACCAGCCTGAAAACATGGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCT 
1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 || || I M 1 1 1 1 1 1 1 1 
TTTTTTTTTGACCAACCTGAAAACATGGTCCGAGTAGAAGCAAAGAACCTTGGTGTTTCT 


1294 


Db 


781 


840 


Qy 


1295 


AT T C AGT T AAAGAAG C T CAAG G C AGAGAC AT T G G C T CT TAAG AT G AAAC AAAT CAT G GAA 1354 
MINI II II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 M 1 1 M 1 1 1 III 
AT T C AGCT AC AGACGCT CAAG GC AGAGT CAT T T GC G CT CAC CAT GAAAAAAAT C AT AGAA 900 


Db 


841 


Qy 


1355 


GACAAGAGAT AC AAGT C C GC G GC AGT G GC T GC C AGT GT CAT CCTGCGCTCC C AC C C G CT C 

1 1 1 1 1 1 1 1 1 1 1 1 II II II III MM III 1 III II I I I I I i I I I M 
i i i i i I 1 1 1 1 ! I 1 1 1 I II III 1 1 1 1 III i ill || 1 II II II II II 

GAC AAGAG GT ACAAGT CT G C AGCAAT G GC CT C CAAGAT TAT CAG GC AC T C C CAC C CAC T G 


1414 


Db 


901 


960 


Qy 


1415 


AGCCCCACACAGCGGCTGGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACG 

Ml 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I I I | | | | || | | | | | 

AC C C C T G C C C A GAG GCTTTTGGGCTG GAT AG AT CAT AT C T T G CAG AC AG G G G G T G CAG C A 


1474 


Db 


961 


1020 


Qy 


1475 


CACCTCAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTT 
M II 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II II || 
CATCTCAAGCCATATGCTTTCCAGCAGCCAT GGCATGAGCAGTACAT GCTTGAT GT CTTC 


1534 


Db 


1021 


1080 


Qy 


1535 


GTGTTTCTGCTGGGGCTCACTCTGGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I I I 
CTCTTTCTCCTAGGGCTCATGCTGGGTACTTTGTGGCTTAGTGTAAAGGTTCTTGTTGCT 


1594 


Db 


1081 


1140 


Qy 


1595 


GCTGTCTGGTGGCTGCGTGGGGCCAGAAAGGTGAAGGAGACATAA 1639 
1 1 1 1 1 1 1 1 1 1 III II 1 1 1 1 1 1 1 II 1 1 1 1 1 
GTAACC AG GT AT CT GAGT AT AG CAAC GAAGGT CAAG GAG G C AT AA 1185 




Db 


1141 
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AK041045 1353 bp mRNA linear HTC 19-SEP-2003 

Mus musculus adult male aorta and vein cDNA, RIKEN full-length 
enriched library,, clone :A530069C13 product : hypothetical 
UDP-glucoronosyl and UDP-glucosyl transferase containing protein, 
full insert sequence. 
AK041045 

AK041045. 1 GI: 2 6334156 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 
1 



Craniata ; Vertebrata ; Euteleos tomi ; 
Sciurognathi; Muridae; Murinae; Mus. 



Carninci,P. and Hayashizaki , Y . 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 
Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 
Normalization and subtraction of cap-trapper-selected cDNAs to 



JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



COMMENT 



prepare full-length cDNA libraries for rapid discovery of new gene 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata, K 
Konno, H . , 
Sumi, N 



Akiyama, J. , Nishi , K . , 
Ishii, Y. , Nakamura, S . , 



Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P. 

Kitsunai,T., Tashiro,H., Itoh,M. , 
Hazama,M., Nishine,T., Harada,A., 
Yamamoto, R. , Matsumoto, H . , Sakaguchi, S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J. 
Okazaki,Y., Muramatsu, M. , Inoue f Y. f Kira,A. and Hayashizaki, Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 1353) 

Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida,K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii, Y. , Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno, H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura, M., Nishi, K. , Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
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FEATURES 

source 



CDS 



Location/ Qualifiers 
1. .1353 

/organism="Mus musculus" 

/mol__type="mRNA" 

/strain="C57BL/6J" 

/db_xr e f = " FANTOM_DB :A530069C13" 

/db_xref="MGI: 2405959" 

/db_xref="taxon: 10090" 

/clone="A530069C13" 

/sex="male" 

/tissue_type="aorta and vein" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 

/dev_stage="adult" 

83. .991 

/note="unnamed protein product; hypothetical 

UDP-glucoronosyl and UDP-glucosyl transferase containing 

protein ( InterPro | IPR002213, evidence: InterPro) 

putative" 

/ codon_start=l 

/protein_id="BAC30796. 1" 

/db_xref="GI: 26334 157" 

/translation="MAAHRRWLLMSFLFLEVILLEAAKILTISTLSASHYIVISRVSQ 
VLHEGGHNVTKLLYESANIPDFRKEKPSYQVINWRPPEDQEKKFADLRHRLTEEITYG 
RSKHHTLLKIHQYFGDLCSQLLSRKDIMDFLKNENFDLVLLDSMDLCSLLIVEKLGKR 
FVSFLPFQFSYMDFGLPSAPLSYAPVYGSGLTDQMDFWGRVKNFLMFLDFSMKQREIL 
SQYDSTIQEHFVEGSQPVLSDLLLKAELWFVNSDFALDFARPLFPNTVYVGGYWTNLF 
SQYPKTWRILSLSLETQVLSLWPWAL" 



ORIGIN 



Query Match 31.5%; 
Best Local Similarity 73.1%; 
Matches 981; Conservative 



Score 731.6; DB 11; 
Pred. No. l.le-196; 
0; Mismatches 354; 



Length 1353; 
Indels 7; Gaps 



3; 



Qy 

Db 



16 



AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 6 0 
I I I I I I I I II I I I I I I I I I I I I | MMI 

AGGGTCCCTTAGTGGGGCACAGCTCTTTAGGTGTGCAACCTGTGTCAGGGCTCCACATAT 75 



Qy 

Db 

Qy 

Db 



61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

76 TCTACAGATGGCAGCACATCGGCGTTGGCTTCTCATGAGCTTCCTTTTCCTTGAGGTTAT 135 

121 G C T C T C AGAGG C T GC C AAAAT C C T GAC AAT AT CT AC AGT AGGT GGAAG C CAT TAT C TACT 18 0 

I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I 
136 T CT CTT GGAGGCT GC AAAAAT C CT GACT AT AT CT ACACT GAGT GCAAGC CAT TAT AT AGT 195 



Qy 

Db 

Qy 

Db 

Qy 

Db 



181 GAT G GAC CGGGTTTCT C AGAT T C T T CAAGAT C AC GGT CAT AAT GT C AC C AT GC T T AAC C A 24 0 

Ml II I I I I I I I I I I II I I I I I I I I I II I I I I I I III I 

196 GAT AAG CCGTGTGTC GCAAGTT CT T CAT GAAG GT G GC C ACAAT GT GAC CAAAC TT CTT T A 2 55 

241 CAAAAGAGGT CCTTTTAT GC CAGATTTTAAAAAGGAAGAAAAAT CAT AT CAAGTTAT CAG 300 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
256 TGAAA GT G CT AAT AT C C CAGAT T T T AGAAAG GAAAAAC CAT CAT AT C AAGT T AT T AA 312 

301 TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 

I I I I I I I I I I I I I I I I I I I III I I I I I | | M || || 

313 TTGGCGTC C AC C T G AAGAT CAG GAAAAGAAAT T T G C T GAT C T TAG G CAT C GAC T T AC AG A 372 



Qy 


361 


AGAAACT T TAG GT GGC AG AG GAAAAT T T GAAAAC T TAT TAAAT GT T CT AGAAT AC T T G GC 
1 1 1 1 1 1 1 1 1 1 1 IN 1 1 1 1 1 II 1 1 II 1 1 1 1 1 M 1 
AGAAAT AAC TT AT GGC AG GT C C AAAC AT C AC AC C C T T CTAAAGAT C CAT CAAT AC T T T G G 


420 


Db 


373 


432 


Qy 


421 


GT T GC AGT G C AGT CAT T T T T TAAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT G AGAA 4 8 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 
GGACT TAT G C AGT CAAT TAT T AAG C AGAAAG GAC AT CAT GGAC TT CT T AAAAAAT G AGAA 4 92 


Db 


433 


Qy 


481 


CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 
IN IN 1 II 1 1 1 1 1 1 III 1 1 II 1 1 1 1 1 | M | | | | | | | | | | 
CTTTGACCTAGTACTTCTTGATTCAATGGATCTCTGTTCTTTGCTAATTGTTGAAAAGCT 


540 


Db 


493 


552 


Qy 


541 


TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TGGGAAACGATTTGTGTCCTTTCTTCCCTTTCAATTTAGCTATATGGACTTTGGGTTACC 


600 


Db 


553 


612 


Qy 


601 


AA TCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTT 

II IN 1 1 1 1 1 1 1 II 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AAGCGCCCCCTTGTCCTATGCTCCAGTGTATGGTTCTGGTCTAACTGACCAAATGGACTT 


657 


Db 


613 


672 


Qy 


658 


CTGGGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACAT 
1 M 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I I I I 
CTGGGGCCGAGTGAAGAACTTTCTGATGTTCCTTGATTTCTCCATGAAGCAAAGGGAAAT 


717 


Db 


673 


732 


Qy 


718 


GCAGT CTACATTT GACAACACCATCAAGGAACATTTCACAGAAGGCT CTAGGCCAGTTT T 
1 IN 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CCTTT CT CAGTAT GACAGCACTAT CCAGGAGCATT TT GT GGAAGGCT CT CAGCCAGT GT T 


777 


Db 


733 


792 


Qy 


778 


GTCTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTT 

MM 1 1 1 1 II 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 

GTCTGACCTTCTACTGAAAGCTGAGCTGTGGTTTGTCAACTCTGACTTTGCTTTGGATTT 


837 


Db 


793 


852 


Qy 


838 


TGCTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAA 
1 1 1 1 1 1 M 1 1 1 1 1 1 1 II II 1 1 II 1 1 1 1 1 1 I 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 
TGCTCGTCCCCTGTTTCCCAACACAGTCTATGTGGGAGG-TTACTGGACAAACCTGTTCA 


897 


Db 


853 


911 


Qy 


898 


ACCAGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCT 
1 M 1 M 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 II 1 II 1 1 1 I I I I I I 1 I I I 
G C CAAT AC C C C AAG AC T T G G AG AAT T T TAT C T C T C AG T T T G G AGAC T C AG GTTTTGTCCT 


957 


Db 


912 


971 


Qy 


958 


T GT GAC CT T G GG C T C C AT GGT GAAC AC CT GT C AGAAT C C G GAAAT CT T C AAGGAG AT GAA 
M 1 1 M M 1 1 1 1 1 II 1 1 1 1 II | | | | II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 

■ * ' 1 1 ' 1 * 1 ' 1 1 1 1 1 1 • 1 1 l l l J | l I I | 1 1 1 [ 1 F J 1 III 

T GT GGCCCT GGGCT CT AT AGT GAGCAT GAT T CAGT C CAAGGAAAT T ATTAAGGAGAT GAA 


1017 


Db 


972 


1031 


Qy 


1018 


CAATGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCC 
M 1 1 1 II II 1 1 1 II 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 I | | III II II 1 1 1 1 1 1 1 1 1 1 
CAGTGCCTTTGCTCACCTCCCTCAAGGGGTGCTATGGACATGTAAGACTTCTCATTGGCC 


1077 


Db 


1032 


1091 


Qy 


1078 


CAAAGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCT 

M II II II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 II 1 

CAAAGAT GT CAGT TT GGC CCCAAAT GT CAAAAT CAT GGATT GGCT T C CACAGACT GAC CT 


1137 


Db 


1092 


1151 


Qy 


1138 


CCTGGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGA 

M 1 1 1 1 M 1 1 1 1 1 1 1 1 I M | | | | | | | | | | | | | | | | | Mill 1 1 II 1 1 

T C TAG C T C AC C C TAG CAT TCGTCTGTTTGT C AC T CAT GGAG G GAT GAAC AGT GT GAT G GA 


1197 


Db 


1152 


1211 



Qy 1198 GGCCATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAA 1257 



Ill 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I II I 1 1 1 1 1 1 1 II 1 1 1 1 

Db 1212 GGCTGTCCATCATGGAGTACCCATGGTGGGGATTCCATTTTTTTTTGACCAACCTGAAAA 12 71 

Qy 1258 CAT G GT C C GAGT AGAAG C C AAAAAGT TTGGTGTTTC TAT T C AGT T AAAGAAG CT C AAG G C 1317 

I I I I M I I I I I I I I II I I II II I I I I I I I I I I I I I I I I | || | M I I II I II II 
Db 1272 CAT GGT CC GAGT AGAAG CAAAGAAC CT T GGT GT T T C TAT T C AGC TAC AGAC G CT C AAG GC 1331 

Qy 1318 AGAGACATT GGCT CT TAAGAT G 1339 

I I I I I I I I I I I I I II I 
Db 1332 AG AGT CAT T T G C G C T C AC CAT G 1353 



RESULT 8 
BI102968 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



ORIGIN 



BI102968 978 bp mRNA linear EST 26-JUN-2001 

602888578F1 NCI_CGAP_Kidl4 Mus musculus cDNA clone IMAGE: 5043978 
5 1 , mRNA sequence. 
BI102968 

BI 102968. 1 GI: 145538 61 
EST. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 (bases 1 to 978) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Jeffrey E. Green, M.D. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Incyte Genomics, Inc. 

CI one distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : //image . llnl . gov 

Plate: LLAM11120 row: k column: 19 
High quality sequence stop: 812. 

Location/Qualifiers 

1. .978 

/organism= ,f Mus musculus" 
/mol_type="mRNA" 
/strain="FVB/N" 
/db_xref="taxon: 10090" 
/ clone= " IMAGE :5043978" 

/lab_host="DH10B (Tl phage-resistant) " 
/clone_lib="NCI__CGAP_Kidl4" 

/note="Organ: kidney; Vector: pCMV-SP0RT6; Site_l: Not I; 
Site_2: Sail; Cloned unidirectionally . Primer: Oligo dT . 
Average insert size 1.75 kb . Constructed by Life 
Technologies. Note: this is a NCI_CGAP Library. |" 



Query Match 22.5%; Score 522.4; DB 12; Length 978; 

Best Local Similarity 77.7%; Pred. No. 4.7e-137; 

Matches 682; Conservative 0; Mismatches 191; Indels 5; Gaps 



4; 



Qy 644 GATCACATGGACTTCTGGGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGG 7 03 

II M I I I I I I I I I II I I I II I III I I I I I I I I I I I I I I I I I I I I I || | 
Db 1 GAC C AAAT G GAC TTTTGGGGCC GAG T GAAG AAC AT T C T GAT GT T C T T T CAT T T C AC C AAG 60 

QY 704 AGGCAACAGCACATGCAGTCTACATTT GACAACACCATCAAGGAACATTT CACAGAAGGC 7 63 

I I I I I I I M III M II I M II II I I I I I I I I I I I I | I I I 

Db 61 AAG C GAAGG GAC AT C TT T T CT C AAT AT G GC AAT AC T GT C C AG GAGCAT TT T G C G GAAG G C 12 0 

Qy 7 64 TCTAGGCCAGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGAC 82 3 

Ml I I I I I I II I I I I I I II I I I I I I II I II I II I I I I I I I I I I I I M I I I 

Db 121 TCTCAGCCAGTGTTGTCTGACCTTCTACTGAAAGCTGAGCTGTGGTTTGTCAACTCTGAC 18 0 

Qy 824 TTTGCCTTTGATTTTGCTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATG 8 83 

I I I I I I I I I I I I I I I I I I I II III I I I I I II I II II I I I I I I M I I II II 

Db 181 TTTGCCTTGGATTTTGCTCGTCCCCTGTTTCCCAACACAGTCTATGTGGGAGGTTTACTG 24 0 

Qy 884 GAAAAAC C TAT T AAAC C AGT AC C AC AAGACT T G GAG AACT T CAT T G C C AAGT T T G G G GAC 94 3 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GACAAAC CT GT T C AG C CAAT AC C C CAAGACT T G GAGGAT T T TAT CT CT C AGT TT GGAGAC 300 

Qy 944 TCTGGTTTTGTCCTTGTGACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATC 1003 

I I I I I I I I I I I I I I I I I I I II I I I I MM I I I I II 

Db 301 TCAGGTTTTGTCCTTGTGGCCCTGGACTCTGTAGTGAGCATGATTCAGTCCAAGGAAATT 360 

Qy 1004 T T C AAG GAGAT GAACAAT GCCTTTGCT C AC C T AC C C C AAG G G GT GAT AT G GAAGT GT C AG 1063 

I II I I II I I I I I I I II M I II I I I I I I I I II I I I I I I I II I I I I II II I II 

Db 361 AT TAAG GAGAT GAACAGT GCCTTTGCT CAC CT C C CT CAAG G GGT GCT AT G GAC AT GTAAG 42 0 

Qy 1064 TGTTCTCATTGGCCCAAAGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTT 1123 

II II I I I I I I I I I I I I I MM I I II Ill I I 

Db 421 AGTTCTCATTGGCCCAAAGATGTCAGTTTGGCCCCAAATGTCAAAATCATGGATTGGCTT 4 80 

Qy 1124 CCTCAGAGTGACCTCCTGGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAG 1183 

M I I II II II II II I I II I I II I II I I I I I II I II I I II II I I I II I M I 
Db 481 CCAC AGAT T GAC C T T C T AGC T CAC C CT AGC AT TCGTCTGTTT GT CAC C CAT G GG GG GAT G 54 0 

Qy 1184 AAT AGC AT AAT G GAGGC C AT C C AG CAT GGT GT GCC CAT GGT G G GGAT CCCTCTCTTT GGA 1243 

MM II II II II II II II II II I I I II I II I I I I I II I I I I II II I 
Db 541 AAC AGT GT AAT GGAGGCT GT C CAT CAT GGAGT AC CAAT GGT AG GGAT T C CAT T T T T T G G A 600 

Qy 1244 GAC C AGCCT GAAAACAT GGT C C GAGT AGAAGC CAAAAAGTT T GGT GTTT CTAT T CAGTT A 1303 

I I M I II I I II I II I I I II II II I I I I II I I M M II II I I I II II II M I I M 
Db 601 GACCAACCTGAAAACATGGTCCGAGTAGAAGCAAAGAACCTTGGTGTTTCTATTCAGCTA 660 

Qy 1304 AAGAAGCT CAAG G CAGAGAC AT T G G CT CT TAAGAT GAAAC AAAT CAT G GAAGACAAGAGA 1363 

Ml II II I I I II II I I I II II I I I II I I I I I || | | | || II I I II 

Db 661 CAGACACT CAAGGCAGAGTCATTTT GGCTCACCAT GAAAGAAGTCATAGAAGACCAGAGG 72 0 

Qy 13 64 TACAAGTCCGCGGCAGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACA 142 3 

I II II I I I I I II I I II III II II I I I I II I II I II I 

Db 721 T AC AAGAC T G C AGC A- T GGC C T C CAAGGT T AT C AG GAAC T C C CAC C — AATGACCCTGGC 777 

Qy 1424 CAGCGGCTGGTGGGCTGGATTGACCACGTC-CTCCAGACAGGGGGCGCGACGCACCTCAA 1482 

Ml I I I I I I I I I I II II II I I III M I II I I II II I I I M I II I I I I I 

Db 77 8 CAG AG GCT T GT G GGC T GGAT T GAT C ACAT C T T T G C AGAC AGGGGGT G C AG C C CAT C T C AA 837 



Qy 1483 G C C CT AT GT C T T - T C AG C AGC C C T G G CAT GAG C AGT AC 1519 

I I I I I I I I I II I I I I I I I I I I I Mill 
Db 838 AG CAT AT G GC T T C C C AG CAGG C T T G GC AT AAC GAGT AC 87 5 



RESULT 9 
BI559553 

LOCUS BI559553 761 bp mRNA linear EST 05-SEP-2001 

DEFINITION 603252894F1 NIH_MGC_97 Homo sapiens cDNA clone IMAGE : 5295502 5', 

mRNA sequence. 
ACCESSION BI559553 

VERSION BI559553.1 GI: 15446867 

KEYWORDS EST. 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 (bases 1 to 761) 

AUTHORS NIH-MGC http://mgc.nci.nih.gov/. 

TITLE National Institutes of Health, Mammalian Gene Collection (MGC) 

JOURNAL Unpublished (1999) 
COMMENT Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Miklos Palkovits, M.D., Ph.D. 

cDNA Library Preparation: Michael J. Brownstein (NHGRI), Shiraki 
Toshiyuki and Piero Carninci (RIKEN) 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : / /image . llnl . gov 

Plate: LLAM11747 row: k column: 23 
High quality sequence stop: 72 6. 
FEATURES Location/Qualifiers 
source 1. .761 

/ organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone=" IMAGE: 5295502" 
/lab_host="DH10B" 
/clone_lib="NIH_MGC_97" 

/note="0rgan: testis; Vector: pBluescriptR (modified 
pBluescript KS+) ; Site_l: BamHI; Site_2 : Sall-Xhol 

(gtcgag) ; Oligo-dT primed using primer 
5 i -TTTTTTTTTTTTTTTTVN-3 ' , size-selected for average 
insert size 2.2 kb and normalized to ROT 5. This is a 
primary library enriched for full-length clones and 
constructed using the Cap-trapper method (Carninci, in 
preparation) . Library constructed by M. Brownstein 

(NIMH/NHGRI, National Institutes of Health) . Note: this is 
a NIHJMGC Library." 

ORIGIN 



Query Match 21.1%; Score 488.6; DB 12; Length 761; 

Best Local Similarity 80.7%; Pred. No. 1.9e-127; 

Matches 608; Conservative 0; Mismatches 139; Indels 6; Gaps 



3; 



QY 8 CTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGAAGTGAGC 67 

I I I I I I I I M I I I I I II I I I II I I I I I I I I I I | | | | | | || Mill II I I II 

Db 6 CTTAGCCCGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCTGCTTCTGTGGAAGTGAGC 65 

Qy 68 ATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCTGCTCTCA 127 

I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 66 ATGGTTGGGCAGCGGGTGCTGCTTCTAGTGGCCTTCCTTCTTTCTGGGGTCCTGCTCTCA 125 

Qy 128 GAG G CT G C C AAAAT C C T GAC AAT AT C T AC AGT AGGT G GAAG C CAT TAT C T AC T GAT GG AC 187 

I I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I II II I I I I I I I M I I II Mill 

Db 12 6 GAGGCT GCCAAAAT CCT GACAAT AT CTACACTGGGT GGAAGC CATT AC CTACTGTT GGAC 185 

Qy 18 8 CGGGTTTCT C AGAT T C T T C AAGAT C AC GG T CAT AAT GT C AC CAT G C T T AAC C AC AAAAGA 247 

Mill I I I II I II II II II II I II II I II II I I II II MUM I II i II 
Db 18 6 CGGGTGTCT C AGAT T C T T C AAGAGC AT GG T CAT AAT GT GAC TAT G C T T CAT C AG AGT G G A 2 45 

Qy 24 8 GGTCCTTT TAT G C C AGAT T T T AAAAAG G AAG AAAAAT CAT AT C AAG T TAT C AGT T G G C T T 307 

Mill I I I II MM I II II I II M I II I I II I I II I II I II 

Db 24 6 AAGT T T T G GAT C C CAGAT AT TAAAGAGGAG GAAAAAT CAT AC CAAGT T AT C AGGT GGT T T 305 

Qy 308 GC AC CT GAAGAT CAT C AAAGAGAAT T T AAAAAGAGT T T T GAT TTCTTTCTG GAAGAAAC T 367 

M M II I II II II II I II I I || II I II I II II II II MM II 
Db 306 T C AC C T GAAGAT CAT C AAAAAAGAAT T AAGAAG CAT T T T GAT AG C T AC AT AGAAAC AG C A 365 

Qy 368 T T AG GT G G C AGAG GAAAAT T T GAAAAC T TAT T AAAT GT T C T AGAAT AC TTGGCGTTG C AG 427 

M I II I II M I II I II I I II MM I I II I I I I I II 
Db 366 T T G GAT G G C AGAAAAGAAT CT GAAGC C C T T GT AAAGCT AAT G GAAAT AT TT G GGACT CAA 425 

Qy 42 8 T GCAGTCATTTTTTAAATAGAAAGGATATCAT GGATTCCTTAAAGAAT GAGAACTTCGAC 4 87 

M M I I I I I III II I II I I I I II II I II II I II II II II II II II I I I M 
Db 426 T GT AGT TAT T T GCT AAG C AGAAAGGAT ATAAT G GAT T C CT TAAAGAAT GAGAACT AT GAT 4 85 

Qy 488 AT GGT GATAGTT GAA- ACTTTT GACTACT GT C CTTT CCT GAT T GCT GAGAAGCTT GGGAA 546 

MM I I II M I I Mill I MM II II I I II II II I II I II II II I I III 

Db 48 6 CTGGTATTTGTTGAACGCATTTGATTTCTGTTCTTTCCTGATTGCTGAGAAGCTTGTGAA 545 

Qy 54 7 GCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCC 606 

M I I I M II I II M I II I I II I II I I M I II I I II I I II M II II II I I III 
Db 54 6 ACCATTTGTGGCCATTCTTCCCACCACATTCGGCTCTATGGATTTGGGGCTACCAAGCCC 605 

Qy 607 CTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACT-GATCACATGGACTTCTGGGGCC 665 

I I M I M M I M M I I II II I II M I I II I I II II I I II II II || || I II I II 

Db 606 CTTGTCTTATGTTCCAGTATTCCCTTCCTTGCTGACTGGATCACATGGACTTCTGGGGCC 665 

Qy 666 GAGT GAAGAAT TT T C T GAT GT T CT T T AGT T T CT GC AGGAG G CAAC AG C AC AT GC AG 721 

M I M M M I II II I II I I I II I I I || | | || I II I II 

Db 666 GAGT GAAGAAATT T C T T GAT GT CT T T T AGT TT C C T C CAAG GAGC C CAAT G G GAC AT G C AG 725 

Qy 722 T CT ACATTT GACAACACCAT CAAGGAACATTT C 754 

I M II I II I M II II II I I I II I I 

Db 72 6 TCTACAATTTGACAACACAT CAAGGAGCATTT C 758 

RESULT 10 
AW173071/c 

LOCUS AW173071 694 bp mRNA linear EST 16-NOV-1999 

DEFINITION xj82gll.xl Soares_NFL_T_GBC_Sl Homo sapiens cDNA clone 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
COMMENT 



FEATURES 

source 



IMAGE: 2663780 3' similar to SW:CGT_RAT Q09426 

2-HYDROXYACYLSPHINGOSINE 1-BETA-GALACTOSYLTRANSFERASE PRECURSOR ;, 

mRNA sequence. 

AW173071 

AW173 071. 1 GI : 6439019 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 694) 

NCI-CGAP http : //www. ncbi . nlm. nih . gov/ncicgap . 

National Cancer Institute, Cancer Genome Anatomy Project (CGAP) , 
Tumor Gene Index 
Unpublished (1997) 

Contact: Robert Strausberg, Ph.D. 
Email : cgapbs-r@mail . nih . gov 

This clone is available royalty-free through LLNL ; contact the 
IMAGE Consortium (info@image.llnl.gov) for further information. 
Seq primer: -40UP from Gibco 
High quality sequence stop: 412. 

Location/Qualifiers 

1. .694 

/ organism- "Homo sapiens 11 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/ clone= " IMAGE :2663780" 
/lab_host="DH10B" 

/clone_lib="Soares_NFL_T_GBC_Sl" 

/note="0rgan: pooled; Vector! pT7T3D-Pac (Pharmacia) with 
a modified polylinker; Site_l: Not I; Site_2 : Eco RI ; 
Equal amounts of plasmid DNA from three normalized 
libraries (fetal lung NbHL19W, testis NHT, and B-cell 
NCI_CGAP_GCB1) were mixed, and ss circles were made in 
vitro. Following HAP purification, this DNA was used as 
tracer in a subtractive hybridization reaction. The driver 
was PCR- amplified cDNAs from pools of 5,000 clones made 
from the same 3 libraries. The pools consisted of 
I.M.A.G.E. clones 297480-302087, 682632-687239, 
726408-728711, and 729096-731399. Subtraction by Bento 
Scares and M. Fatima Bonaldo. " 



ORIGIN 



Query Match 2 0.0%; 

Best Local Similarity 83.5%; 
Matches 537; Conservative 



Score 4 63.6; DB 10; Length 694; 
Pred. No. 2.4e-120; 
0; Mismatches 105; Indels 1; 



Gaps 



l; 



Qy 



Db 



2 68 T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AGT T G G CT T G C AC C T G AAG AT CAT C AAAG 327 

M I M I I I I I M I I I I I I I III | I I I I I I I I I I I I 

643 T AT AAAGAGAAG C AAAAT T CAT AC AG GT AT CCGGGTGGTTTT CAC CT AAGAT CAT CAAAA 584 



Qy 



Db 



32 8 AGAATTTAAAAAGAGTTTTGATTTCTTTCTGGAAGAAACTTTAGGTGGCAGAGGAAAATT 3 87 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

583 AGAA- T T AAGAAGC AT T T T GAT AG CT AC AT AGAAAC AGCAT T G GAT GG CAGAAAAGAAT C 525 



Qy 



388 T GAAAACT T AT TAAAT GT T C T AGAAT ACT T G G C GT T G C AGT GCAGT C AT T T T T T AAAT AG 447 
INI II III I I I I I | | | | I | I I | | | | | | | | | I II 



Db 


524 


T GAAGC C CT T GTANAGCT AAT GGAAATATT T GGGACT CAAT GTAGT T ATT T GCTAAGCAG 


465 


Qy 


448 


AAAG GAT AT CAT GGAT T C CT T AAAG AAT GAGAACT T C GAC AT G GT GAT AGT T G AAAC T T T 

1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II II MM 1 M | M 1 1 II 

AAAG GAT AT AAT GGAT T C C T T AAAGAAT GAGAACT AT GAT C T GGT AT T T GT T GAAG CAT T 


507 


Db 


464 


405 


Qy 


508 


TGACTACTGTCCTTTCCTGATTGCTGAGAAGCTTGGGAAGCCATTTGTGGCCATTCTTTC 
Ml 1 M M II II 1 1 II 1 II II 1 1 1 1 II M 1 1 1 III II 1 II II M 1 1 1 1 II II 1 1 
TGATTTCTGTTCTTTCCTGATTGCTGAGAAGCTTGTGAAACCATTTGTGGCCATTCTTCC 


567 


Db 


404 


345 


Qy 


568 


CACTTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCCCTTGTCTTATGTTCCAGTATT 
Ml M 1 II M 1 1 1 1 1 M 1 1 II 1 M 1 1 1 II 1 II II II II II II II II 1 II II II II 1 
CACCACATTCGGCTCTTTGGATTTTGGGCTACCAAGCCCCTTGTCTTATGTTCCAGTATT 


627 


Db 


344 


285 


Qy 


628 


CCGTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCGAGTGAAGAATTTTCTGATGTT 

N M 1 1 M M 1 M M 1 II II 1 1 1 II II 1 1 M 1 M M II M M II 1 M 1 M M M 1 1 1 M 

CCCTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCGAGTGAAGAATTTTCTGATGTT 


687 


Db 


284 


225 


Qy 


688 


CT T T AGT T T CT G C AGG AGG CAAC AG CAC AT GC AGT C T AC AT T T GAC AAC AC CAT C AAG G A 

1 1 1 1 1 1 1 1 1 M II II II Ml 1 II 1 1 II 1 II II II 1 1 II II 1 1 1 II 1 1 II 

C T T T AGT T T CT C C AG GAG C CAAT G G GAC AT GC AGT C T AC AT T T GAC AAC AC CAT C AAG GA 


747 


Db 


224 


165 


Qy 


748 


AC AT T T CAC AGAAG GCTCT AGGC CAGT T T T GT CT CAT CT T CT ACT GAAAGCAGAGTT GT G 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II II II II II 1 II II 1 M II 1 II 1 11 II II II II II 1 1 II 

GCATTTCCCAGAAGGCTCTAGGCCAGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTG 


807 


Db 


164 


105 


Qy 


808 


GTTCATTAACTCTGACTTTGCCTTTGATTTTGCTCGACCTCTGCTTCCCAACACTGTTTA 

Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! ! 1 1 1 1 1 1 1 1 1 1 1 II II I i i i i i i i i 

1 1 ' M II II M M M 1 M 1 II M 1 II II II II II 1 1 II II 1 1 II II 1 1 II 1 II 1 
GTTTGTTAACTCTGATTTTGCCTTTGATTTTGCCCGGCCCCTGCTTCCCAACACTGTTTA 


867 


Db 


104 


45 


Qy 


868 


T GT T G GAG G C T T GAT G G AAAAAC C TAT T AAAC C AG T AC C AC AA 910 

1 1 1 1 1 II 1 II 1 II II 1 1 1 II 1 II II M II 1 1 M 1 II 1 1 M 1 1 

TAT T GGAG GC T T GAT GGAAAAAC C TAT T AAAC CAGT AC C ACAA 2 




Db 


44 





RESULT 11 

CB435346/c 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
COMMENT 



mRNA linear 
1 , mRNA sequence. 



EST 25-MAR-2003 



CB435346 659 bp 

615435 MARC 6BOV Bos taurus cDNA 
CB435346 
CB43534 6. 1 GI: 2 92162 83 
EST. 

Bos taurus (cow) 
Bos taurus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Cetartiodactyla; Ruminantia; Pecora; Bovoidea; 
Bovidae; Bovinae; Bos. 
1 (bases 1 to 659) 
Smith, T. P. L. , Roberts, A. J. , 
Wray,J.E. and Keele,J.W. 
A second set of bovine ESTs 
Unpublished (2003) 
Contact: Smith TPL 

USDA, ARS , US Meat Animal Research Center 
PO Box 166, Clay Center, NE 68933-0166, USA 
Tel: 402 762 4366 
Fax: 402 762 4390 



Echternkamp, S . E . , Chit ko-McKown, C . G . , 
from pooled-tissue normalized libraries 



Email: smith@email.marc.usda.gov 

Single pass sequencing. Bases called with phred vO. 020425. c and 
trimmed with the aid of the trim_alt option. Vector identified with 
crossmatch vO. 990329. 
Plate: FQY8035 row: J column: 24 
Seq primer: TAGAAGGCACAGTCGAGG . 
FEATURES Location/Qualifiers 
source 1. .659 

/ organism="Bos taurus" 

/mol_type="mRNA" 

/db_xref="taxon: 9913" 

/tissue__type= "pooled" 

/lab_host="DH10B" 

/clone_lib="MARC 6B0V" 

/note="Vector : pcDNA3.1; Site_l : EcoRl; Site_2 : NotI; 
Library made with RNA pooled from multiple tissues 
including liver, lung, hypothalamus, pituitary, and 
placenta/endometrium. " 

ORIGIN 

Query Match 19.7%; Score 457.6; DB 14; Length 659; 

Best Local Similarity 81.1%; Pred. No. 1.2e-118; 

Matches 532; Conservative 0; Mismatches 124; Indels 0; Gaps 0; 



Qy 

Db 


446 
658 


AGAAAGGAT AT CAT GGAT T C CTT AAAGAAT GAGAACTT C GACAT GGT GAT AGTT GAAACT 

i i i 1 1 i I i I inn 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M I I 1 1 1 1 1 1 I I mm 

AGAAAGGAT GT CAT GAAGT CTTT AAAGAAT GAGAACTT C GAC CT GGT GAT AGT GGAAAT G 


505 
599 


Qy 


506 


TTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCTTGGGAAGCCATTTGTGGCCATTCTT 
M 1 II 1 1 1 1 II 1 II 1 1 II II 1 11 II 1 1 1 1 1 II II II 1 1 II 1 II 1 1 II 1 1 1 1 1 II 1 II 
TTTGACTACTGTCCTTTCTTGGTTGCTGAGAAGCTTGGGAAGCCATTTGTGGCCATTCTC 


565 


Db 


598 


539 


Qy 


566 


TCCACTTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCCCTTGTCTTATGTTCCAGTA 

1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 II 1 II 1 II 1 1 1 1 II 1 1 1 II 1 
CCTTCCGCACTGGGCACCGTGGACTTTGGGCTACCAAGCCCTCTGTCTTATGTGCCAGTG 


625 


Db 


538 


479 


Qy 


626 


TTCCGTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCGAGTGAAGAATTTTCTGATG 
IN 1 1 1 1 1 1 1 M M II 1 1 1 II 1 1 1 1 1 1 II 1 II 1 II 1 1 II 1 1 II 1 II II 1 
TT CT ACT CC T T GT T AAC G GAC C AGAT GGACT T CTGGGGCC GAGT AAAGAAC T T C C T GAT G 


685 


Db 


478 


419 


Qy 


686 


T T C T T T AGT T T C T G C AG GAG G C AAC AGC AC AT G C AGT C T AC AT T T GAC AAC AC CAT C AAG 
1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II II 1 1 II II 1 II II II I 1 
T T CT T T GAGT T CT T C AAGAAG C AGT G GAAAAT C CAG T C T G CAT AT GAT GAC AC CAT C AAG 


745 


Db 


418 


359 


Qy 


746 


GAAC ATT T CAC AGAAG GC T CT AGG C C AGT T T T GT C T C AT CT T CT ACT GAAAG CAG AGT T G 
M 1 1 1 II 1 1 II 1 1 II 1 II II II 1 II II II II 1 II II 1 1 1 1 1 II II 1 II 1 II 
GAGCATTTCCCGGACGACTCTAGGCCAGTTTTGTCTCATCTTCTAACAAAAGCAGAGCTG 


805 


Db 


358 


299 


Qy 


806 


TGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCTCGACCTCTGCTTCCCAACACTGTT 
1 1 M 1 1 1 II 1 1 II 1 1 II II II II 1 II 1 1 II 1 1 1 II 1 1 II 1 1 1 II II II 1 II 1 
TGGTTTGTTAACACCGACTTTGCCTTTGATTTTGCTCAGCCCCTGCTTCCCAACACTGTG 


865 


Db 


298 


239 


Qy 


866 


TAT GT T G GAG GC T T GAT G GAAAAAC C TAT T AAACC AGT AC C ACAAGACT T GGAGAAC T T C 
1 1 1 1 II 1 II II III II II II II II II 1 1 1 II II II 1 II 1 II II 1 II III 
T GT AT T G GAG GT T T AAT GT C C AAAC CT GT TAAAC CAGT AC C AC AAGAAT T T GAGAAT T T C 


925 


Db 


238 


179 



Qy 



926 ATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGACCTTGGGCTCCATGGTGAACACC 985 



Db 


178 


II INI 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 I I I | | | | | 1 1 1 1 1 1 1 1 1 1 1 | 1 1 1 1 

i i i i i 1 1 | | lilt | | | | | [ | ! | 1 

ATCACCAAATTTGGAGACTCTGGTTTTGTCCTTGTAAGCCTGGGGTCCATGGTGAGTTTC 


119 


Qy 


986 


T GT CAGAAT C C GGAAAT CTTCAAGGAGAT GAACAAT GC CT TT GCT CAC CT AC C C CAAGGG 

HI MM 1 M 1 1 II 1 II II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ATTCGGTCCCAGGAGGTTCTCAAAGAGATGAATGCTGCCTTTGCTCATCTCCCTCAAGGG 


1045 


Db 


118 


59 


Qy 


1046 


GTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAAAGATGTCCACCTGGCTGCAAA 1101 
1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I II I I | I | | | | | M III 1 1 1 1 1 1 1 1 
G T GAT AT G GAAGT AT AAT C C T T C T CAT T G G C C C AAAGAC AT C AAAT T G G C C C C AAA 3 




Db 


58 





RESULT 12 
AK052644 

LOCUS AK052644 1723 bp mRNA linear HTC 20-SEP-2003 

DEFINITION Mus musculus 0 day neonate kidney cDNA, RIKEN full-length enriched 
library, clone : D630011D02 product : hypothetical UDP-glucoronosyl and 
UDP-glucosyl transferase containing protein, full insert sequence. 
ACCESSION AK052644 

VERSION AK052644.1 GI: 26095303 

KEYWORDS HTC; CAP trapper. 
SOURCE Mus musculus (house mouse) 

ORGANISM Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
REFERENCE 1 

AUTHORS Carninci,P. and Hayashizaki, Y. 
TITLE High-efficiency full-length cDNA cloning 

JOURNAL Meth. Enzymol . 303, 19-44 (1999) 
MEDLINE 99279253 
PUBMED 10349636 
REFERENCE 2 

AUTHORS Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 
TITLE Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 
JOURNAL Genome Res. 10 (10), 1617-1630 (2000) 
MEDLINE 20499374 
PUBMED 11042159 
REFERENCE 3 

AUTHORS Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P., 
Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M. , 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M., Nishine,T., Harada,A. , 
Yamamoto,R., Matsumoto, H . , Sakaguchi , S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 

TITLE RIKEN integrated sequence analysis (RISA) system--38 4-f ormat 

sequencing pipeline with 384 multicapillary sequencer 

JOURNAL Genome Res. 10 (11), 1757-1771 (2000) 

MEDLINE 20530913 
PUBMED 11076861 
REFERENCE 4 

AUTHORS The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

TITLE Functional annotation of a full-length mouse cDNA collection 

JOURNAL Nature 409, 685-690 (2001) 



REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



COMMENT 



FEATURES 

source 



misc feature 



The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 1723) 

Adachi,J., Aizawa,K., Akimura, T . , Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Kara, A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., KagawaJ., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M. , 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A. , Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi , A. , 
Muramatsu,M. and Hayashizaki, Y. 
Direct Submission 

Submitted ( 16- JUL-2 001) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res @gsc . riken . go . jp, 
URL :http: //genome. gsc. ri ken. go . jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL : http : //genome . gsc . riken . go . jp/ 
URL :http : / /f antom. gsc. riken . go . jp/ . 

Location/Qualifiers 

1. .1723 

/organism="Mus mus cuius" 

/mol_t ype= "mRNA" 

/strain="C57BL/6J" 

/ db_xref ="FANTOM_DB : D6300 11D02 " 

/db_xref="MGI : 2422342" 

/db_xref="taxon: 10090" 

/clone="D630011D02" 

/ tissue_type="kidney" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="0 day neonate" 
1. .1723 

/note="hypothetical UDP-glucoronosyl and UDP-glucosyl 
transferase containing protein ( InterPro | IPR002213, 
evidence: InterPro) " 



ORIGIN 



Query Match 19.5%; Score 452.6; DB 11; Length 1723; 

Best Local Similarity 69.1%; Pred. No. 4.9e-117; 

Matches 649; Conservative 0; Mismatches 284; Indels 6; Gaps 



2; 



Qy 


1 


AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 
1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | M 1 1 
AGGGTCCCTTAGTGGGGCACAGCTCTTTAGGTGTGCAACCTGTGTCAGGGCTCCACATAT 100 


Db 


41 


Qy 


61 


AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TCTACAGATGGCAGCACATCGGCGTTGGCTTCTCATGAGCTTCCTTTTCCTTGAGGTTAT 160 


Db 


101 


Qy 


121 


GC T CT C AGAGGCT GC CAAAAT CC T GACAAT AT CTACAGT AG GT G GAAG C CAT T AT CT AC T 180 

MM 1 M 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 | II II 1 1 1 1 II II II 1 
TCTCTTGGAGGCTGCAAAAATCCTGACTATATCTACACTGAGTGCAAGCCATTATATAGT 220 


Db 


161 


Qy 


181 


GAT G GAC C GGGT T T CT C AGAT T CT T CAAGAT C AC GGT C AT AAT GT C AC C AT GC T T AAC C A 2 4 0 

IN M 1 II 1 1 1 1 1 1 1 1 1 II I I || | | || 1 1 1 1 1 1 1 III 1 

GAT AAGC C GT GT GT C GCAAGT T CT T CAT GAAGGT G G C C ACAAT GT GAC CAAACT T C TT T A 2 80 


Db 


221 


Qy 


241 


C AAAAG AG GT C C T T T TAT GC C AG AT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 3 00 
IN M II Ml 1 II 1 1 II 1 1 1 1 1 1 1 1 II II | || 1 1 II II M 1 M 1 1 

> ■ ii iii i ■ i i i i i i i i i i i i ( i i i i I l l 1 l l l l [ l l l l | | ; 

TGAAA GT G CT AAT AT C C C AGAT T T T AGAAAGGAAAAAC CAT CAT AT C AAGT TAT T AA 337 


Db 


281 


Qy 


301 


TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 

1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 II III II 1 1 1 1 1 M II M 

TT GG C GT C CAC C T GAAGAT C AGGAAAAGAAAT T T GCT GAT C T T AGGC AT C GACT T ACAGA 397 


Db 


338 


Qy 


361 


AGAAACTT T AGGT GGCAGAGGAAAAT T T GAAAACT T ATT AAAT GT T CT AGAAT ACT T G GC 420 

1 M M 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 II II M II 1 1 
iii i j i i i i i i i ii i i i i i i i i 

AGAAATAACTTATGGCAGGT C CAAACATCACACCCTT CTAAAGAT C CAT CAAT ACTTT GG 457 


Db 


398 


Qy 


421 


GTT GCAGT GC AGT C AT T T T T TAAAT AGAAAGGAT AT CAT GGAT T C CT T AAAGAAT GAGAA 4 8 0 

1 1 1 1 1 1 1 M II MM 1 II 1 1 II 1 II 1 1 1 1 II 1 1 II 1 II 1 1 II 1 1 1 1 

G GAC T TAT GCAGT CAAT TAT T AAGC AGAAAGGACAT CAT GGAC T T CT T AAAAAAT GAGAA 517 


Db 


458 


Qy 


481 


CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 540 

1 1 1 1 1 1 1 M 1 MM 1 III 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 
> ■ > ■ ■ i « iiii i i ii iiii i i i i ii i i i i iii i i i i i 

CTTTGACCTAGTACTTCTTGATTCAATGGATCTCTGTTCTTTGCTAATTGTTGAAAAGCT 577 


Db 


518 


Qy 


541 


TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

1 M 1 1 1 I M M M 1 M 1 M M 1 1 1 III II 1 1 II 1 1 1 II 1 II II 1 1 

TGGGAAACGATTTGTGTCCTTTCTTCCCTTTCAATTTAGCTATATGGACTTTGGGTTACC 637 


Db 


578 


Qy 


601 


AA TCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTT 657 

M M II II II 1 1 1 1 1 M 1 1 1 1 1 IIII II 1 1 II | || | | || 1 1 M 
AAGCGCCCCCTTGTCCTATGCTCCAGTGTATGGTTCTGGTCTAACTGACCAAATGGACTT 697 


Db 


638 


Qy 


658 


CTGGGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACAT 717 

M 1 1 1 II 1 1 II 1 1 1 1 II 1 II 1 II II 1 1 1 II II II II 1 II II || || | | M 

CTGGGGCCGAGTGAAGAACTTTCTGATGTTCCTTGATTTCTCCATGAAGCAAAGGGAAAT 7 57 


Db 


698 


Qy 


718 


G C AGT C T AC AT T T GAC AACAC CAT C AAG GAAC AT T T C AC AG AAGG C T C TAG G C C AGT T T T 7 77 

1 IN 1 II 1 II 1 1 1 1 II II II 1 1 1 1 1 II II 1 1 II 1 1 1 1 1 I 1 1 1 
CCTTTCTCAGTATGACAGCACTATCCAGGAGCATTTTGTGGAAGGCTCTCAGCCAGTGTT 817 


Db 


758 


Qy 


778 


GTCT CAT CTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCT GACT TTGCCTTTGATTT 837 

IIII 1 M 1 1 II II 1 1 1 1 II III 1 1 1 M M 1 M 1 1 1 1 II 1 1 1 1 II M Mill 

GTCTGACCTTCTACTGAAAGCTGAGCTGTGGTTTGTCAACTCTGACTTTGCTTTGGATTT 87 7 


Db 


818 


Qy 


838 


TGCTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAA 897 



Db 878 TGCTCGTCCCCTGTTTCCCAACACAGTCTATGTGGGAGGTTTACTGGACAAACCTGTTCA 937 

Qy 8 98 AC C AGT AC C AC AAGAC T T G GAGAAC T T CAT T GC C AAGT T 93 6 

I I I I I I I I I I I II II II I II || 

Db 938 GC CAAT AC C C CAAGTAAGT GACAAAT T AGCT CT CACT TT 97 6 



RESULT 13 

CB952493 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



ORIGIN 



CB952493 724 bp mRNA linear EST 29-APR-2003 

AGENCOURT_136928 69 NIH_MGC_176 Mus musculus cDNA clone 
IMAGE: 30303573 5', mRNA sequence. 
CB952493 

CB9524 93. 1 GI: 302 08612 
EST. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 (bases 1 to 724) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email : cgapbs-r@mail . nih . gov 

Tissue Procurement: Dr. Michael Brownstein 
cDNA Library Preparation: Michael Brownstein Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http : / / image . llnl . gov 

Plate: NDCM74 row: e column: 22 

High quality sequence stop: 541. 
Location/Qualif iers 
1. .724 

/organism="Mus musculus" 
/mol_type="mRNA" 
/db_xref="taxon: 10090" 
/clone="IMAGE: 30303573" 

/labJiost="DH10B (Tl-phage-resistant ) " 
/clone_lib="NIH_MGC_17 6" 

/note="Organ: kidney; Vector: pDNR-LIB; Site_l: Sfil 
(ggccattatggcc) ; Site_2: Sfil (ggccgcctcggcc) ; c DNA made 
by oligo-dT priming and directionally cloned. 5 f and 3' 
adaptors were used in cloning as follows: 
5 1 - AAGC AGT G GT AT CAAC G CAGAGT GGC CAT T ACG GC C G GG - 3 1 and 
5 * -ATTCTAGAGGCCGAGGCGGCCGACATG-dT (30) NN-3 T . Full-length 
enriched library was constructed using the Clontech 
Creator SMART kit and size-selected to contain the 0.5 kb 
size fraction. Library created in the laboratory of M. 
Brownstein (NIMH, NIH). Note: this is a NIH MGC Library." 



Query Match 19.4%; Score 450; DB 14; Length 724; 

Best Local Similarity 78.3%; Pred. No. 1.9e-116; 



Matches 565; Conservative 0; Mismatches 155; Indels 2; Gaps 2; 

Qy 685 GT T CT T T AGT T T C T GC AG GAGG C AAC AGC AC AT G C AGT CT AC AT T T GAC AAC AC CAT C AA 744 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I 
Db 3 GT T CCT T GATTT CT CCAT GAAGCAAAGGGAAAT C CT TT CT CAGTAT GACAGCACT AT C CA 62 

Qy 745 GGAAC ATT T C AC AGAAGGCT C T AGGC C AGT T T T GT CT C AT C T T C TACT GAAAG C AGAGTT 8 04 

III I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I II III I 

Db 63 GGAGCATTTTGTGGAAGGCTCTCAGCCAGTGTTGTCTGACCTTCTACTGAAAGCTGAGCT 122 

Qy 805 GTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCTCGACCTCTGCTTCCCAACACTGT 8 64 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II III I I I I I I I I I I II 
Db 123 GTGGTTTGTCAACTCTGACTTTGCTTTGGATTTTGCTCGTCCCCTGTTTCCCAACACAGT 182 

Qy 865 T TAT GT T G GAG G C T T GAT G G AAAAAC C TAT T AAAC C AGT AC C AC AAG AC T T G GAG AAC T T 924 

I I I I I I I I I I II I I I I I I I I I I II I III I I I I I I I I I I I I I I I I I I II 

Db 183 CT AT GT G G GAGGT T TACT GGAC AAAC C T GT T CAGCCAAT AC C C C AAGAC T T G GAGAAT TT 242 

Qy 925 CATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGACCTTGGGCTCCATGGTGAACAC 9 84 

II I I I I I I I I I I I I I I I I I I I I I I I II II I II I I I I I I I II I I I I II 

Db 2 43 TATCTCTCAGTTTGGAGACTCAGGTTTTGTCCTTGTGGCCCTGGGCTCTATAGTGAGCAT 302 

Qy 985 C T GT C AG AAT C C G G AAAT C T T C AAG GAG AT G AAC AAT GCCTTTGCT C AC C T AC C C C AAG G 1044 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 303 GAT T CAGT C CAAGGAAAT TAT T AAGGAGAT GAAC AGT GCCTTTGCT C AC CT C C CT CAAGG 3 62 

Qy 1045 GGT GAT ATGGAAGT GT C AGT GT T CT CATT GGC CCAAAGAT GT C CACCT GGCT GCAAAT GT 1104 

I I I I I I I I I I III II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 363 GGT GCT AT GGACAT GT AAGACTT CT CAT T GGC C CAAAGAT GT C AGT T T G G C C C CAAAT GT 422 

Qy 1105 GAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCACCCAAGCATCCGTCTGTT 1164 

I I I I I I I I I I I I I I I I I I I I I I I II I I II I II I I I I I I I I I I I I I I I I I I 
Db 423 CAAAATCATGGATTGGCTTCCACAGACTGACCTTCTAGCTCACCCTAGCATTCGTCTGTT 4 82 

Qy 1165 T GT C AC C C AC GG C G G G C AGAAT AGC AT AAT GGAG G C CAT C C AG CAT GGTGTGCC CAT G GT 1224 

I I I I I I II II I II III II I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 483 T GT CAC T CAT GGAGG GAT GAAC AGT GT GAT GGAGGC T GT C CAT CAT G GAGT AC C CAT GGT 542 

Qy 1225 GG G GA- TCCCTCTCTT T GGAGAC C AGC CT GAAAAC AT GGT C C G AGT AGAAGC CAAAAAGT 12 83 

I I I I I III I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 543 GG G GAT T C CAT TTTTTTTTT GAC C AAC CT GAAAACAT G GT C CGAGT AGAAGCAAAGAAC C 602 

Qy 1284 TT GGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGAGACATT GGCTCTTAAGAT GAAAC 1343 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINI 
Db 603 T T G GT GTT T CT AT T C AG CT AC AGAC G C C T C AG GCAGAGT C ATT T G C GCT CAC CAT GAAAA 662 

Qy 1344 AAAT CAT GGAAGAC AAGAGAT ACAAGT C C GC G GCAGT GGCT GC CAGT GT CAT CCTGCGCT 1403 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I 
Db 663 AAAT C CTAGAAGAC-AGAGGT ACAAGT CT GCAGCAAT GGCCT C CAAGAT TAT CAGGCACT 721 

Qy 1404 CC 1405 

I I 

Db 722 CC 723 



RESULT 14 
CB158774 



LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 
JOURNAL 
COMMENT 



FEATURES 

source 



CB158774 481 bp mRNA linear EST 29-JAN-2003 

K-EST0218183 L18POOLlnl Homo sapiens cDNA clone L18POOLlnl-14-D07 
5 ! , mRNA sequence. 
CB158774 

CB158774.1 GI:28143912 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 481) 

Kim,N.S., Hahn,Y., Oh,J.H., Lee,J.Y. f Ahn,H.Y., Chu,M.Y., Kim, M. R. r 
Oh,K.J., Cheong, J. E. , Sohn,H.Y., Kim, J.M., Park,H.S., Kim, S . and 
Kim,Y.S. 

21C Frontier Korean EST Project 2001 
Unpublished (2002) 
Contact: Kim YS 
Genome Research Center 

Korea Research Institute of Bioscience & Biotechnology 

52 Eoeun-dong Yuseong-gu, Daejeon 305-333, South Korea 

Tel: +82-42-860-4470 

Fax: +82-42-860-4409 

Email: yongsung@mail . kribb . re . kr 

Plate: 14 row: D column: 07 

High quality sequence stop: 481. 

Location/Qualifiers 

1. .481 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="L18POOLlnl-14-D07" 

/cell_line="SNU-354+Cho-CK+Choi-CK+HLK-3" 
/lab_host="Topl0F' " 
/clone_lib="L18POOLlnl" 

/note="Organ: Liver; Vector: pT7T3-Pac; Site_l: EcoRI; 
Site_2 : NotI; The library was contributed by the Soares 
laboratory and it was constructed as described by Bonaldo, 
M.F., Lennon, G. and Soares, M.B. (1996), Genome Research 
6(9): 791-806. RNA was prepared from harvested cell 
culture . " 



ORIGIN 



Query Match 19.2%; 
Best Local Similarity 99.8%; 
Matches 445; Conservative 



Score 444.4; DB 14; 
Pred. No. 6.3e-115; 
0; Mismatches 1; 



Length 4 81; 
Indels 0; 



Gaps 



0; 



Qy 

Db 



1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
36 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 95 



QY 
Db 

Qy 

Db 



61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

96 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 155 

121 GCT CT C AGAG GC T G C C AAAAT CCT GACAAT AT C T ACAGT AGGT GGAAG C CAT TAT C TACT 18 0 

I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I 

15 6 GCT C T C AGAGGC T G C C AAAAT C CT GACAAT AT C T ACAGT AGGT G GAT GC CAT TAT C TACT 215 



Qy 181 GAT GGAC CGGGTTTCT CAGAT T C T T CAAGAT CAC G GT CATAAT GT C AC CAT G CT T AAC C A 24 0 

i I I I I I I I I I I I I I I I I I I I I I | | M I I I I I I I I | | | | | | | | | | i I I I I | | | | | | | | | | | 
Db 216 GAT G GAC CGGGTTTCT CAGAT T C T T CAAGAT CAC G GT CATAAT GT CAC CAT G C T T AAC C A 275 

QY 241 CAAAAGAG GT C CT T T TAT GC CAGAT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT C AG 300 

I I I I I I M I I I I I I I I I M I I I I I I I I I I I | | | | | | | | | | M I I I I I I I I I I I I I I | I I I 
Db 27 6 CAAAAGAG GT C C T T T TAT G C CAGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 335 

Qy 301 TTGGCTTG CAC C T GAAG AT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 360 

I I I I M M I I I I II I I II I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I | | | | || | | | | 

Db 336 TTGGCTTG CAC C T GAAG AT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG GA 395 

Qy 361 AGAAACT T T AGGT GGC AGAG GAAAATT T GAAAACTTATTAAAT GT T CT AGAAT AC T T GG C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I 

Db 396 AGAAACTTTAGGTGGCAGAGGAAAATTTGAAAACTTATTAAATGTTCTAGAATACTTGGC 4 55 

Qy 421 GT T G C AGT G C AGT CAT T T T T T AAAT A 446 

I I I I I I II II I I I I I I I I I I I I I I I I 
Db 45 6 GTTGCAGTGCAGTCATTTTTTAAATA 4 81 



RESULT 15 

AI694348/C 

LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
COMMENT 



FEATURES 

source 



AI694348 583 bp mRNA linear EST 17-DEC-1999 

wd45g04.xl Soares_NFL_T_GBC_Sl Homo sapiens cDNA clone 
IMAGE: 2331126 3 1 similar to SW:CGT_MOUSE Q64676 

2-HYDROXYACYLSPHINGOSINE 1-BETA-GALACTOSYLTRANSFERASE PRECURSOR ;, 

mRNA sequence. 

AI694348 

AI694348.1 GI:4971688 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 583) 

NCI-CGAP http : / / www . ncbi . nlm. nih . gov/ncicgap . 

National Cancer Institute, Cancer Genome Anatomy Project (CGAP) , 
Tumor Gene Index 
Unpublished (1997) 

Contact: Robert Strausberg, Ph.D. 
Email: cgapbs-r@mail.nih.gov 

This clone is available royalty-free through LLNL ; contact the 
IMAGE Consortium (info@image.llnl.gov) for further information. 
Insert Length: 929 Std Error: 0.00 
Seq primer: -40UP from Gibco 
High quality sequence stop: 462. 

Location/Qualif iers 

1. .583 

/ organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9 606" 
/ clone= " IMAGE :2331126" 
/lab_host="DH10B" 

/clone_lib= M Soares_NFL_T_GBC_Sl" 

/note="Organ: pooled; Vector: pT7T3D-Pac (Pharmacia) with 



a modified polylinker; Site_l : Not I; Site_2 : Eco RI ; 
Equal amounts of plasmid DNA from three normalized 
libraries (fetal lung NbHL19W, testis NHT, and B-cell 
NCI__CGAP_GCB1) were mixed, and ss circles were made in 
vitro. Following HAP purification, this DNA was used as 
tracer in a subtractive hybridization reaction. The driver 
was PCR-amplified cDNAs from pools of 5,000 clones made 
from the same 3 libraries. The pools consisted of 
I.M.A.G.E. clones 297480-302087, 682632-687239, 
726408-728711, and 729096-731399. Subtraction by Bento 
Soares and M. Fatima Bonaldo. " 

ORIGIN 



Query Match 19.1%; Score 442; DB 9; Length 583; 

Best Local Similarity 85.0%; Pred. No. 3.3e-114; 

Matches 493; Conservative 0; Mismatches 87; Indels 0; Gaps 0; 



Qy 


331 


AT T T AAAAAGAGT T T T GAT TTCTTTCTG GAAGAAAC T T T AGGT G GC AGAG GAAAAT T T GA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 I 1 I M I 1 1 

AATTAAGAAGCATTNT GAT AGCT ACATAGAAACAGCATT GGAT GGCAGAAAAGAAT CT GA 


O Zf \J 


Db 


581 


522 


Qy 


391 


AAACTTATT7VAA.TGTTCTAGAATACTTGGCGTTGCAGTGCAGTCATTTTTTAAATAGAAA 
1 M Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 I M I | | | | 
AGC C CT T GTANAG C T AAT GGAAAT ATT T G GGAC T CAAT GT AGT T AT T T GC T AAGCAGAAA 


450 


Db 


521 


" vJZ. 


Qy 


451 


GGAT AT CAT GGAT T C CT T AAAGAAT GAGAAC TT C GACAT G GT G AT AGT T GAAACT T T T GA 
1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 II 1 I I I I | | | | | | | | | | | | 
GGAT AT AAT G GAT T C C T T AAAGAAT GAGAAC TAT GAT C T G GT AT T T GTT GAAGC AT T T GA 


510 


Db 


461 


402 


Qy 


511 


CTACTGTCCTTTCCTGATTGCTGAGAAGCTTGGGAAGCCATTTGTGGCCATTCTTTCCAC 
1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II I I | M II III 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 
TTTCTGTTCTTTCCTGATTGCTGAGAAGCTTGTGAAACCATTTGTGGCCATTCTTCCCAC 


570 


Db 


401 


342 


Qy 


571 


TTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCCCTTGTCTTATGTTCCAGTATTCCG 

1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II II 1 II I I M | || | | | || | | 
CACATTCGGCTCTTTGGATTTTGGGCTACCAAGCCCCTTGTCTTATGTTCCAGTATTCCC 


630 


Db 


341 


282 


Qy 


631 


TTCCTTGCTGACTGATCACATGGACTTCTGGGGCCGAGTGAAGAATTTTCTGATGTTCTT 

1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 II I I | | | | | | | | | I 1 1 1 I 1 I II 1 1 1 

TTCCTTGCT G AC T GAT C AC AT G G AC TTCTGGGGCC GAG T G AAG AAT TAT C T GAT GT T C T T 


690 


Db 


281 


222 


Qy 


691 


T AGT T T C T GC AG GAG G C AAC AG C AC AT G C AG T C T AC AT T T G AC AAC AC CAT C AAG GAAC A 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 IN I 1 II 1 1 1 1 1 1 1 1 1 1 I I I I I | II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 
T AGT T T CT C C AG GAGC CAAT GG GACAT GCAGT CT ACATT T GACAACAC CAT CAAGGAG C A 


750 


Db 


221 


162 


Qy 


751 


TTTCACAGAAGGCTCTAGGCCAGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTT 
1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II II I || 1 1 1 1 1 1 1 I I I || | | | M | | | | | | | | | 
TTTCCCAGAAGGCTCTAGGCCAGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTT 


810 


Db 


161 


102 


Qy 


811 


CATTAACTCTGACTTTGCCTTTGATTTTGCTCGACCTCTGCTTCCCAACACTGTTTATGT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 I 1 I 1 1 1 1 1 1 1 II 1 1 1 
TGTTAACTCTGATTTTGCCTTTGATTTTGCCCGGCCCCTGCTTCCCAACACTGTTTATAT 


870 


Db 


101 


42 


Qy 


871 


T G GAG G CT T GAT G GAAAAAC CT AT T AAAC C AGT AC C ACAA 910 

1 II 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 

T G GAG G C T T GAT G GAAAAAC C TAT TAT T AC G GT AC C AC AA 2 




Db 


41 





Search completed: May 16, 2004, 14:01:53 
Job time : 8801 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



Searched: 



May 16, 2004, 04:18:54 ; Search time 14319 Seconds 

(without alignments) 
7022.546 Million cell updates/sec 

US-10-017-867A-281 
2320 

1 agggtcccttagccgggcgc tctctccccaacctcactaa 2320 

IDENTITY__NUC 

Gapop 10.0 , Gapext 1.0 



3470272 seqs, 21671516995 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



6940544 



Post-processing : 



Database : 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 

GenEmbl : * 



1: 


gb_ba : * 


2: 


gb htg:* 


3: 


gb__in: * 


4: 


gb om : * 


5: 


gb ov:* 


6: 


gb_pat : * 


7: 


gb ph : * 


8: 


gb_pl : * 


9: 


gb_pr : * 


10 


: gb_ro : * 


11 


: gb sts:* 


12 


: gb sy:* 


13 


: gb un : * 


14 


: gb vi : * 


15 


: em ba : * 


16 


: em_f un : * 


17 


: em hum : * 


18 


: em in : * 


19 


: em mu : * 


20 


: em om : * 


21 


: em or : * 


22 


: em ov: * 


23 


: em pat: * 


24 


: em ph : * 


25 


: em_pl : * 


26 


: em ro : * 


27 


: em sts:* 



28 : 


em 


un : * 


2 9 : 


em 


vi : * 


OA. 

3 0 : 


em 


htg hum:* 


31 : 


em 


_htg_inv: * 


32 : 


em 


htg other:* 


33 : 


em 


_htg_mus : * 


O A - 

34 : 


em 


_htg_pln : * 


3d : 


em 


htg rod:* 


JO. 


em 


htg mam : * 


37: 


em 


htg vrt : * 


38: 


em 


sy : * 


39: 


em 


htgo hum: * 


40: 


em 


htgo mus : * 


41: 


em 


_htgo_other : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 

% 

Result Query 





No . 


Score 


Match 


Length 


DB 


ID 


Description 




1 


2320 


100 


.0 


2320 


6 


AX697213 


AX697213 


Sequence 




Z 


2320 


100 


. 0 


2320 


9 


AY358416 


AY358416 


Homo sapi 




3 


231U . 2 


99 


.6 


2341 


6 


AX136141 


AX136141 


Sequence 




A 


XolU . 2 


99 


. 6 


2341 


6 


BD123523 


BD123523 


Secretory 




c 
D 


oqi n o 
ZolU . Z 


99 


. 6 


2 341 


9 


T\ t f\ ^ r~ >"\ r\ o 

AK075383 


AK075383 


Homo sapi 




6 


91 n? ft 


90 


.6 




D 


/\AOfi oUj / 


AX548037 


Sequence 




1 


1281.6 


55 


.2 


2082 


6 


AX359921 


AX359921 


Sequence 




8 


1281. 6 


55 


.2 


2797 


6 


AX155211 


AX155211 


Sequence 




9 


1281.6 


55 


.2 


2823 


6 


AX714604 


AX714604 


Sequence 




10 


1281. 6 


55 


.2 


2823 


9 


AK057066 


AK057066 


Homo sapi 




11 


1280 


55 


.2 


2086 


6 


AX327327 


AX327327 


Sequence 




12 


1212 


52 


.2 


1572 


6 


AX359923 


AX359923 


Sequence 


c 


13 


957. 6 


41 


.3 


88948 


2 


AC008947 


AC008947 


Homo sapi 




14 


957.6 


41 


.3 


179513 


9 


AC016612 


AC016612 


Homo sapi 




15 


944.8 


40 


.7 


1569 


6 


AX155213 


AX155213 


Sequence 




16 


912.4 


39 


.3 


2210 


10 


AK128903 


AK128903 Mus muscu 




17 


912.2 


39 


.3 


2192 


10 


BC034837 


BC034837 Mus muscu 




18 


912.2 


39 


. 3 


2196 


10 


BC022134 


BC022134 Mus muscu 




19 


910.8 


39 


.3 


2212 


6 


AX155214 


AX155214 


Sequence 




20 


909.2 


39 


.2 


2228 


10 


BC025940 


BC025940 Mus muscu 




21 


789 


34 


. 0 


1569 


6 


AX155216 


AX155216 


Sequence 




22 


595. 4 


25, 


.7 


148069 


2 


AC025476 


AC025476 


Homo sapi 




23 


595.2 


25, 


.7 


770 


6 


AX136483 


AX136483 


Sequence 




24 


595.2 


25, 


.7 


770 


6 


BD123723 


BD123723 


Secretory 




25 


593.4 


25. 


. 6 


1842 


6 


AX747286 


AX747286 


Sequence 




26 


593.4 


25. 


. 6 


1842 


9 


AK091977 


AK091977 


Homo sapi 




27 


592.2 


25. 


.5 


102255 


2 


AC026735 


AC026735 


Homo sapi 




28 


575.4 


24. 


. 8 


5002 


9 


AK125803 


AK125803 


Homo sapi 




29 


573. 6 


24. 


.7 


125145 


2 


AC022136 


AC022136 


Homo sapi 




30 


573.4 


24. 


.7 


3108 


9 


BC035012 


BC035012 


Homo sapi 


c 


31 


538. 8 


23. 


,2 


148069 


2 


AC025476 


AC025476 


Homo sapi 


c 


32 


538.4 


23. 


.2 


594 


6 


AX136632 


AX136632 


Sequence 


c 


33 


538.4 


23. 


2 


594 


6 


BD123872 


BD123872 


Secretory 



c 
c 
c 



34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 



444.8 
433.6 
320.6 
308.2 

308 
245.2 
239.2 
239.2 

174 
167.2 
167.2 
165.6 



19.2 88948 

18.7 105885 

13.8 156499 

13.3 251769 
13.3 156499 

211178 
125145 



10.6 
10.3 
10.3 165304 



7.5 
7.2 
7.2 
7.1 



1879 
3598 
4185 

2633 



2 AC008947 

9 AC008860 
2 AC132893 
2 AC117913 
2 AC132893 

10 AC139209 
2 AC022136 

9 AC112204 
5 AF129809 

10 AK128994 
10 RNU07683 
10 RATCERUDPG 



AC008947 Homo sapi 
AC008860 Homo sapi 
AC132893 Mus muscu 
AC117913 Rattus no 
AC132893 Mus muscu 

AC139209 Mus muscu 
AC022136 Homo sapi 
AC112204 Homo sapi 
AF129809 Gallus ga 
AK128994 Mus muscu 
U07683 Rattus norv 
L21698 Rat ceramid 



ALIGNMENTS 



RESULT 1 
AX697213 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 

FEATURES 

source 



AX697213 2320 bp DNA 

Sequence 281 from Patent WO0078961. 
AX697213 

AX697213. 1 GI: 294 9 8151 



linear PAT 02-APR-2003 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Ferrara,N., Stewart , T .A. , Williams, P.M., Baker, K. P., Desnoyers , L . , 
Eaton, D.L., Gao,W.Q., Pan, J., Botstein,D., Fong,S., Goddard,A., 
Godowski, P . J . , Gurney,A.L., Smith, V. , Tumas,D., Wood, W. I., 
Grimaldi , C . J . , Hillan,K.J., Paoni,N.F., Roy, M. A. and Watanabe,C.K. 
Secreted and transmembrane polypeptides and nucleic acids encoding 
the same 

Patent: WO 0078961-A 281 28-DEC-2000; 
Genentech Inc. (US) 

Location/Qualifiers 

1. .2320 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon: 9606" 



ORIGIN 



Query Match 100.0%; Score 2320; DB 6; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 232 0; Conservative 0; Mismatches 



0; Indels 



0; Gaps 



0; 



Qy 

Db 

Qy 

Db 



1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 

I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I 

1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 



61 



61 



AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 

Mill Ml I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I 

AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 



60 



60 



120 



120 



Qy 121 G C T CT C AGAG G C T G C C AAAAT C C T GACAAT AT C T AC AGT AG GT G GAAG C CAT TAT C T AC T 18 0 



Db 


121 


1 1 I 1 1 1 1 1 1 1 1 I I | | | | | | | | | I 1 | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | 1 
GCT CT C AGAGG C T G CCAAAAT C CT GACAAT AT C T ACAGT AGGT GGAAG C CAT TAT CT AC T 


180 


Qy 


181 


GAT G GAC CGGGTTTCT C AGAT T C T T CAAG AT C AC G GT C AT AAT GT C AC CAT G C T T AAC C A 
1 1 II 1 II 1 1 1 I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 i 1 1 1 1 1 1 
GAT GGAC CGGGTTTCT CAGAT T C T T CAAGAT CAC G GT C ATAAT GT C AC C AT GC T T AAC C A 


240 


Db 


181 


240 


Qy 


241 


CAAAAGAGGTCCTTTTATGCCAGATTTTAAPAAGGAAGAAAAAT CAT AT CAAGTTAT CAG 

1 1 N II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I l l l l l 

CAAAAGAGGT CCTTTT AT GCCAGATTTTAAAAAGGAAGAAAAAT CAT AT CAAGTTAT CAG 


300 


Db 


241 


300 


Qy 


301 


T T G G C T T GC AC CT GAAGAT CAT C AAAGAGAAT T T AAAAAGAGT T T T GAT TTCTTTCT GGA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 
TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 


360 


Db 


301 


360 


Qy 


361 


AGAAACTTTAGGTGGCAGAGGAAAATTTGAAAACTTATTAAATGTTCTAGAATACTTGGC 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
AGAAAC T T T AGGT G GC AGAGGAAAAT T T GAAAAC T TAT TAAAT GT T C T AGAAT AC T T G G C 


420 


Db 


361 


420 


Qy 


421 


GT T G C AGT G CAG T CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT G AGAA 

M M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I l I I I I I I I I 

GT T G C AGT GC AGT CAT T T T TT AAAT AGAAAG GAT AT CAT GGAT T C CT T AAAGAAT GAGAA 


480 


Db 


421 


480 


Qy 


481 


CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 

1 1 M M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 I I I I I ll l I I I I i i 

CTT C GACAT GGT GATAGTTGAAACT T TT GACT ACT GT CCTTT C CT GAT T GCT GAGAAGCT 


540 


Db 


481 


540 


Qy 


541 


TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 

1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | | | | | | | | | 1 | | | 1 1 | | i| | | | 1 1 | i i i i i j i i i i i i i i i 

' ' • 1 1 ■■ 1 1 ■■ I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 [ 1 1 1 III 

TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 


600 


Db 


541 


600 


Qy 


601 


AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 

1 1 N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | | | | | | | | 1 | || i | | 1 | | | i i i i i i i i i i i i M i 

AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 


660 


Db 


601 


660 


Qy 


661 


G GG C C GAGT GAAGAAT T T T C T GAT GT T C T T T AGT T T CT GCAGGAG G C AAC AGC AC AT GC A 

M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l I ll ll i I ll I I i i i i i i i i i i i i i 

GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 


720 


Db 


661 


720 


Qy 


721 


GT C T AC AT T T GAC AAC AC CAT CAAG GAAC AT T T C AC AGAAG GC T C T AGG C C AGT T T T GT C 
M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 I 1 1 M i 1 1 1 1 1 1 1 
GT CT AC AT T T GAC AAC AC CAT CAAG GAAC AT T T CAC AGAAG GCTCTAGGC C AGT T T T GT C 


780 


Db 


721 


780 


Qy 


781 


TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 

1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | || | | | | | | | | 1 | | 1 | | | 1 | | | | | | I I | | | | i i i | | i i i 

TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 


840 


Db 


781 


840 


Qy 


841 


TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 
N II 1 M 1 II 1 1 1 1 1 1 1 1 M 1 1 II 1 1 II II 1 1 1 1 1 II II II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 
TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 


900 


Db 


841 


900 


wy 




AtalAUUALAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 

1 1 N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 


960 


Db 


901 


960 


Qy 


961 


GAC CTT GGGCT C CAT GGT GAACAC CT GT CAGAAT CC G GAAAT CTT CAAGGAGAT GAACAA 

1 N 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


1020 



Db 961 GAC CTT GGGCT C CAT GGT GAACACCT GT CAGAAT C C GGAAAT CTT CAAGGAGATGAACAA 1020 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 10 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

Qy 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | | I I I 
Db 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

Qy 1141 G GCT C AC C CAAGC AT CCGTCTGTTTGT C AC C CAC GGC G G G C AG AAT AGCAT AAT G GAGG C 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I II I I I I I I I 
Db 1141 G G C T CAC C C AAG CAT CCGTCTGTTTGT CAC C CAC G G C G G G CAGAAT AG CAT AAT G GAG G C 12 00 

Qy 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I II | I I I 
Db 12 01 CAT CCAGCAT GGT GT GC CCAT GGT GGGGAT C CCT CT CT T T GGAGAC CAGC CT GAAAACAT 12 60 

Qy 12 61 GGT C C GAGT AGAAGC C AAAAAGT T T GGT GT T T C TAT T C AGT T AAAGAAG C T C AAG G C AGA 132 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I 
Db 1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 

Qy 1321 GAC ATT GGCT CT TAAGAT GAAACAAAT CAT G GAAGACAAGAGAT ACAAGT C C GCG G CAGT 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1321 GACATT GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT CCGCGGCAGT 1380 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I II I I I II I I I I I II I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I II I M I I 

Db 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 



Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

QY 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 19 8 0 

I I M M I I I II I I I I I I I I I II I I I I | I | | | I I | | | | | | | | | | | | | | | | M I I I I I I I I I 

Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2040 

I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I II I I I I M I I I I II I I I I I I I I I I I I I I 
Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2040 

Qy 2041 T G C C C C T AC TAT C TAT CAT G GAAT AAC AT C C AAGAAAGAC AC C T T G CAT AT T C T T T C AG T 23 00 

M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I | 

Db 2041 T GC C C CT AC TAT C TAT CAT G GAAT AAC AT C C AAGAAAGAC AC CT T G CAT AT T C T T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I M I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 C AGT GAG CTCCTTCTTGGCT GAGC AG G CAT G GAGACT GT AGGT T T C C AGAT T T C CT GAAA 2280 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 80 

Qy 22 81 AAT AAAAGT T T AC AG C GT TAT C T C T C C C C AAC CT C AC T AA 2 320 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2281 AAT AAAAGT T T AC AGC GT TAT C T C T CC C C AAC C T CAC TAA 232 0 



RESULT 2 
AY358416 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 



AY358416 2320 bp mRNA linear PRI 03-OCT-2003 

Homo sapiens clone DNA71169 glucuronosyltransf erase (UNQ842) mRNA, 
complete cds . 
AY358416 

AY358416.1 GI: 37181956 
FLI_CDNA. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 2320) 

Clark, H.F., Gurney,A.L., Abaya,E., Baker, K. , Baldwin, D., Brush, J., 
Chen, J., Chow, B., Chui,C, Crowley, C, Currell,B., Deuel, B., 
Dowd,P., Eaton, D., Foster, J., Grimaldi,C, Gu,Q., Hass,P.E., 
Heldens,S., Huang, A. , Kim,H.S., Klimowski , L . , Jin,Y., Johnson, S., 
Lee, J., Lewis, L., Liao,D., Mark,M., Robbie, E., Sanchez, C. , 
Schoenfeld, J. , Seshagiri , S . , Simmons, L., Singh, J., Smith, V., 
Stinson,J., Vagts,A., Vandlen,R., Watanabe,C, Wieand,D., Woods, K., 
Xie,M.H., Yansura,D., Yi,S., Yu,G., Yuan, J., Zhang, M. , Zhang, Z., 
Goddard,A. , Wood, W.I. and Godowski,P. 

The Secreted Protein Discovery Initiative (SPDI), a Large-Scale 



JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



gene 
CDS 



ORIGIN 



Effort to Identify Novel Human Secreted and Transmembrane Proteins: 

A Bioinf ormatics Assessment 

Genome Res. 13 (10), 2265-2270 (2003) 

12975309 

2 (bases 1 to 2320) 

Clark, H. F. 

Direct Submission 

Submitted (01-AUG-2003) Department of Bioinf ormatics , Genentech, 
Inc., 1 DNA Way, South San Francisco, CA 94080, USA 

Location/Qualifiers 

1. .2320 

/organism= f, Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="DNA71169" 
1. .2320 

/locus_tag="UNQ842" 
68. .1639 

/locus_tag="UNQ842" 

/note="PRO1780" 

/codon_start=l 

/product="glucuronosyl transferase" 
/protein_id="AAQ8 8782 .1" 
/db_xref="GI: 37181957" 

/translation="MAGQRVLLLVGFLLPGVLLSEAAKILTISTVGGSHYLLMDRVSQ 

ILQDHGHNVTMLNHKRGPFMPDFKKEEKSYQVISWLAPEDHQREFKKSFDFFLEETLG 

GRGKFENLLNVLEYLALQCSHFLNRKDIMDSLKNENFDMVIVETFDYCPFLIAEKLGK 

PFVAILSTSFGSLEFGLPIPLSYVPVFRSLLTDHMDFWGRVKNFLMFFSFCRRQQHMQ 

STFDNTIKEHFTEGSRPVLSHLLLKAELWFINSDFAFDFARPLLPNTVYVGGLMEKPI 

KPVPQDLENFIAKFGDSGFVLVTLGSMVNTCQNPEIFKEMNNAFAHLPQGVIWKCQCS 

HWPKDVTiLAANVKIVDWLPQSDLIAHPSIRLFVTHGGQNSIMEAIQHGVPMVGIPLFG 

DQPEN1WRVEAKKFGVSIQLKKLKAETLALKMKQIMEDKRYKSAAVAASVILRSHPLS 

PTQRLVGWIDHVLQTGGATHLKPYVFQQPWHEQYLFDVFVFLLGLTLGTLWLCGKLLG 
MAVWWLRGARKVKET " 



Query Match 100.0%; Score 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 2320; Conservative 0; Mismatches 



DB 9; Length 2320; 
0; Indels 0; 



Gaps 



0; 



Qy 


1 


AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 

1 1 i N M 1 1 1 1 1 1 1 I I I I | | 1 1 1 1 1 1 M I I I | | | | | | | | | | II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 


60 


Db 


1 


60 


Qy 


61 


AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 | | | | || | M 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 

AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 


120 


Db 


61 


120 


Qy 


121 


GCT CT C AGAGGCT GC CAAAAT C CT GACAATAT CT ACAGTAGGT GGAAGC CAT T AT CT ACT 

1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 
GCT CT C AGAGGCT G C CAAAAT C CT GACAATAT CT ACAGTAGGT GGAAG C CAT TAT CT AC T 


180 


Db 


121 


180 


Qy 


181 


GAT G GAC CGGGTTTCT CAGAT T CT T CAAGAT C AC G GT C AT AAT GT CAC CAT G C TT AAC C A 

1 1 '1 M 1 1 II 1 1 1 I II | || || | | | M | M | || | | | | | | | | ,| | ,, | || || , ,| | | 

GAT G GAC CGGGTTTCT CAGAT T CT T CAAGAT CAC G GT CAT AAT GT CAC CAT GCT T AAC C A 


240 


Db 


181 


240 



Qy 



241 CAAAAGAGGTCCTTTTATGCCAGATTTTAAAAAGGAAGAAAAATCATATCAAGTTATCAG 300 



iiiiiiiiiiii 1 1 1 1 1 1 J J 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

'ATCAG 300 



241 CAAAAGAGGTCCTTTTATGCCAGATTTTAAAAAGGAAGAAAAATCATATCAAGTT. 



301 TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 

9ni NIIIIIIIMIIIllliiMMIIIIII I I I I I I I I 1 I I I I I I I I l I (, i i i , 

301 TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 
361 AGAAACTTTAGGTGGCAGAGGAAAATTTGAAAACTTATTAAATGTTCTAGAATACTTGGC 420 

0 ^ 11111 Nil INI | || | in | | mi I I III MM IN in | || | in | |, 

361 AGAAACTTTAGGTGGCAGAGGAAAATTTGAAAACTTATTAAATGTTCTAGAATACTTGGC 420 

421 GTTGCAGTGCAGTCATTTTTTAAATAGAAAGGATATCATGGATTCCTTAAAGAATGAGAA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | 
421 GTTGCAGTGCAGTCATTTTTTAAATAGAAAGGATATCATGGATTCCTTAAAGAATGAGAA 480 

4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 540 

JB1 IIIMIIIIIIMIIIMIIIIIIIIMMIIMIIIMMIIII MINIM 

4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 540 
541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

C/11 HHIIIIIIIMIIIIIIIIIIMllillllllllMIIIIIIIIIIMIlllllllll 

541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

en , I I I 'I I I I I I I I I I I I II I I I I I I I I | | I I I I I | | | | | | M I I I II II I I I I | || 

601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | || I I I I I I I | | || I I I I II I I I I || 

661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

721 GTCTACATTTGACAACACCATCAAGGAACATTTCACAGAAGGCTCTAGGCCAGTTTTGTC 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | M I II I II I I I I | 

721 GTCTACATTTGACAACACCATCAAGGAACATTTCACAGAAGGCTCTAGGCCAGTTTTGTC 780 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

n „ ii mill i iii in in in mi mi mi i n i ii i ii 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I M I I II II II M I II I I I I | || || M I I I I I I I I I M I I II II I I I 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 90 0 

901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

n I I I I M II I II I I I I II I I I I I || I II II II I I I II I I I I I I I I || | || | || | | | 

901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

961 GACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGAGATGAACAA 

I I I I I I I M I II I I I I I I II I I I I I I I II II I | || | | | | | I I I I I I I I I I I I I I I 



961 GACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGAGATGAACAA 
1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 

' ' ' ' ' ' ' ' ' ' I I I M I II II I I II I I I I I I I I II II I I I I I | | | | | | | | | | | | | | | | | | | 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 



1020 
1020 
1080 



1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

MMMMM IMIIIMM 1 I I I M I I M I I II I Ml 



1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 



1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

I ' I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | II I I I I I I | | | | | | | | | 
1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

I > N I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I | | | M | | | | | | | | | | | | | | | | | 

1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I | | | | | | I I I I I I I 
12 61 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 



1321 



1380 



GACATTGGCTCTTAAGATGAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT 
I I N II I I I I I I I I I I I I I I I I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 
1321 GACATTGGCTCTTAAGATGAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT 1380 



1381 
1381 
1441 
1441 



GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I I ' I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I II 

GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I N I I I I I I I I I II I I I I I I I I I I I I | | | I I I I I I I I I I I | | | | | | | I I I I I I I M I I I 

GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 



1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 



1561 
1561 



GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 
I I I I I I I I M I I I I I I I I I I I I I | | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I 
GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 



1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

' " I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 



1621 



1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | I I 
1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 0 0 

1 1 1 I I I > I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I | | | | | | | | | | 
18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

loc1 Illllllllllllllllllllllllllllllllllllllllllllllllllll 

1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

inoi I I I I I N I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I 

1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 



Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2040 

I I 1 I HI I I I I I I I I I I II I I II I I | I I | | | | | | | | M | | M I I I I I I | | | | | | | | | | | | 
Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2040 

Qy 2 041 T G C C C C T AC TAT C TAT CAT GGAAT AAC AT C C AAGAAAGAC AC C T T G CAT AT T C T T T C AGT 210 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I | I I I I I I I I I I 

Db 2041 T GC CC CT ACT AT CT AT CAT GGAAT AAC AT C CAAGAAAGACAC C T T GC AT AT T CT T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I M | | | | | | | | | | | | | | 

Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

M I I I I I I I I I II II II I I I I II I I I I I I | I | | | | M | | | | M | | | | | | || | | | 

Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

22 21 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 
N I I I I I I I i I I I I I M I I I I I I I I I I I I I I I I I | I I I I I I I I I I I | I | | | | | | | | | | | I 
Db 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

Qy 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 

I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | 

Db 2281 AAT AAAAGT T T AC AG C GT TAT CT C T C C C C AAC C T C AC T AA 2320 



RESULT 3 
AX136141 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 

FEATURES 

source 



CDS 



AX136141 2341 bp DNA 

Sequence 63 from Patent EP1067182. 
AX136141 

AX136141. 1 GI: 14272549 



linear PAT 30-MAY-2001 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Ota,T., Isogai,T., Nishikawa, T . , Kawai,Y., Sugiyama,T. and 
Hayashi, K. 

Secretory protein or membrane protein 
Patent: EP 1067182-A 63 10-JAN-2001; 
Helix Research Institute (JP) 

Location/Qualifiers 

1. .2341 

/organism= ff Homo sapiens" 
/mol_type="unas signed DNA" 
/db_xref="taxon: 9606" 
94. .1665 

/note="unnamed protein product" 
/ codon__start=l 
/protein_id="CAC39713 . 1" 
/db_xref="GI : 14272550" 
/ db_x r e f = " REMTREMB L : C AC 39713" 

/ translation="MAGQRVLLLVGFLLPGVLLSEAAKILTISTVGGSHYLLMDRVSQ 
ILQDHGHNVTMLNHKRGPFMPDFKKEEKSYQVISWLAPEDHQREFKKSFDFFLEETLG 
GRGKFENLLNVLEYLALQCSHFLNRKDIMDSLKNENFDMVIVETFDYCPFLIAEKLGK 



PFVAILSTSFGSLEFGLPIPLSYVPVFRSLLTDHMDFWGRVKNFLMFFSFCRRQQHMQ 
STFDNTIKEHFTEGSRPVLSHLLLKAELWFINSDFAFDFARPLLPNTVYVGGLMEKPI 
KPVPQDLENFIAKFEDSGFVLVTLGSMVNTCQNPEIFKEMNNAFAHLPQGVIWKCQCS 
HWPKDVHLAANVKIVDWLPQSDLLAHPSIRLFVTHGGQNSIMEAIQHGVPMVGIPLFG 
DQPENMVRVEAKKFGVSIQLKKLKAETLALKMKQIMEDKRYKSAAVAASVILRSHPLS 
PTQRLVGWIDHVLQTGGATHLKPYVFQQPWHEQYLLDVFVFLLGLTLGTLWLCGKLLG 
MAVWWLRGARKVKET " 

ORIGIN 



Query Match 99.6%; Score 2310.2; DB 6; Length 2341; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2312; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I | | | || I I I | | | | | 

Db 27 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 8 6 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I II I II II I I I 
Db 87 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 14 6 

Qy 121 G C T C T C AG AG G C T G C C AAAAT C C T G AC AAT AT C T AC AGT AG GT G G AAG C CAT TAT C T AC T 18 0 

I I I I I I I I I I I I I I I I M II I I I I I I I I I I | | || I II I t I I I I I I I I I I I I I I I I I I I I I 
Db 147 GCT C T C AGAGGC T GCCAAAAT C C T G AC AAT AT CT AC AGT AG GT G GAAG C CAT TAT C TACT 206 

Qy 181 GAT GGAC C GGGT TT CT CAGATT CTT CAAGAT CAC GGT CAT AAT GT CAC C AT GCTTAAC CA 24 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II MINIM 

Db 207 GAT G GAC CGGGTTTCT C AGAT T C T T CAAGAT CAC GGT CAT AAT GT CAC C AT GCT T AAC C A 266 

Qy 241 C AAAAG AG G T C C T T T TAT G C C AG AT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 300 

M N I I II II I I Ml I II II II I I II I II I M Mill M I 

Db 267 C AAAAG AG G T C C T T T TAT G C C AG AT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 32 6 

Qy 301 TTGGCTTG CAC C T G AAGAT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 360 

M I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I 

Db 327 T T GG CT T GCAC CT GAAGAT CAT C AAAGAGAAT T TAAAAAGAGT TT T GAT TTCTTTCT GGA 386 

Qy 3 61 AGAAACT TT AG GT GGCAGAGGAAAATT T GAAAACT TAT T AAAT GT T CT AGAAT ACT T GG C 42 0 

I I I I M II I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | I II I II I I I I I I I I I I I I 
Db 387 AGAAACT T TAG GT GG C AGAGGAAAAT T T GAAAAC TTAT T AAAT GT T C T AGAAT ACT T GG C 44 6 

Qy 421 GT T GCAGT GCAGT CAT T T TTTAAAT AGAAAGGATAT CAT GGAT T C CTTAAAGAAT GAGAA 4 80 
I M I I I I I I I I I I I I I II I II I M II II I I I I I II II I I I II I I M I II M I I I 

Db 447 GT T G C AGT G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C CT T AAAGAAT GAGAA 506 

Qy 481 CT T C GACAT GGT GAT AGT T GAAAC T TT T GAC TACT GT CCTTTCCT GAT T G CT GAGAAGC T 54 0 

I I I M II I II II II II I II II I I || || I M I I II M I I I I I II II II I I I II II I 

Db 507 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 566 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I M II I I I I M M I I I II I I I I I I I I I I I I I I I | | I | | | | | M | | | | | | | | | | | | 
Db 567 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 626 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

M I I M I I I I I I I I I I I II I I I I I I II I I | | | | M I I I I I I II I I I I I I II I I I I I I II I 
Db 627 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 686 



661 G G G C C GAGT GAAGAAT T T T C T GAT GT T C T T T AGT T T CT G C AG GAG G C AAC AG C AC AT G C A 72 0 

N I I I I I I I I I I I I | | | | | | | I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I 

68 7 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 74 6 
721 GT CT ACAT T T GAC AACAC CAT CAAGGAACAT T T C AC AGAAGG CT CT AG G C C AGT T T T GT C 78 0 

I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I 

74 7 GT C T AC AT T T GAC AAC AC CAT CAAG G AAC AT T T C AC AGAAG GC T C TAG G C C AGT T T T GT C 8 06 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I M I I I I I I I I I I I II I I II I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I II I I 
8 07 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 866 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 90 0 

M I I I I I I I M II I I I I II I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I 

867 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 926 

901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 9 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

92 7 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGAGGACTCTGGTTTTGTCCTTGT 98 6 

961 GAC CTTGGGCTC CAT G G T G AAC AC C T G T C AG AAT C C G G AAAT C T T CAAG GAG AT GAAC AA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
987 GACCTT GGGCTC CAT GGT GAACACCTGT CAGAAT CCGGAAATCTT CAAGGAGAT GAACAA 1046 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 
I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I | | M I I I I I I 

1047 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1106 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I II I I I I I I II I I I I I I I I I M I 

1107 AG AT GT C C AC C T G G C T G C AAAT G T G AAAAT T GT G GAC TGGCTTCCT C AG AGT GAC C T C C T 1166 

1141 GGCT CAC C CAAGC AT CCGTCTGTTTGT C AC CC AC GG C GG GC AGAAT AG CAT AAT G GAG GC 1200 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I | | | | M I I I I I I I I 1 I I M I I I | | 

1167 GGCT CAC C CAAG CAT CCGTCTGTTTGT CAC C CAC G GC GG G CAGAAT AGCAT AAT G GAGGC 1226 

1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

I I I M I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I 
1227 CAT C CAGC AT GGT GT G C C CAT GGT GG GGAT CCCT CT C TT T GGAGAC C AG C C T GAAAAC AT 128 6 

1261 G G T C C GAGT AGAAG C C AAAAAGT TTGGTGTTTC TAT T C AGT T AAAGAAG CT CAAG G C AG A 132 0 

I I I I I i I N I I M I I I I I M I I II I I I I I I I I I I I II I I I M | | M I I I II I I M I I I I | 
1287 GGT C C GAGT AGAAG CCAAAAAGTTT GGT GT T T C TAT T CAGT TAAAGAAG CT CAAGGC AGA 1346 

1321 GACAT T GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGTC C GC GGC AGT 138 0 

I I N I I I I I I I I I I I I I | | | | | | | I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I 
134 7 GACAT T GGCT CT T AAGAT GAAACAAAT CAT G GAAGACAAGAGAT AC AAGT C CGC G GC AGT 14 0 6 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I N I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | I I I I I I I I I I I I I I I I I I I I I II I I I 
1407 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1466 

14 41 GATT GAC CAC GTCCTCCAGACAGGGGGCGC GAC GCACCT CAAGC CCT AT GTCTTTCAGCA 150 0 

N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 mi iiiii: 

14 67 GAT T GAC CAC GT C CT C C AGAC AGGG G G C G C GAC G CAC C T CAAG C C C TAT GT CT T T CAGC A 152 6 
1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 



Db 


1527 


1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 1 1 1 1 1 1 1 1 1 
GCCCTGGCATGAGCAGTACCTGCTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 15 8 6 


Qy 


1561 


GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 
1 1 N 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 | | | M | | | | 1 1 1 1 1 1 1 1 I I I I I I I I I I 1 1 1 1 1 1 
GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 164 6 


Db 


1587 


Qy 


1621 


AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

1 1 1 N 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 
AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1706 


Db 


1647 


Qy 


1681 


TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 
N 1 1 M 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 II 1 II 1 1 1 II II 1 1 II 1 1 1 1 1 1 1 1 1 1 I | | | | | | | | 
TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 66 


Db 


1707 


Qy 


1741 


TATCTCCTGTTTTCTTGAAG7VACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 I I I I I I I | | | | | | | | | 

TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1826 


Db 


1767 


Qy 


1801 


ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 
1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 I | | | || 
ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAATTCTTTCCAGTCCT 1886 


Db 


1827 


Qy 


1861 


CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 
1 1 1 N 1 1 II 1 II 1 1 M 1 M M 1 1 1 M 1 II 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 || I | | | || | || | | 
CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1946 


Db 


1887 


Qy 


1921 


TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 19 8 0 

M 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 

TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 2 006 


Db 


1947 


Qy 


1981 


C GAAT C AC AC C C T GAC T C T T C CAG C CT C CAT GT C CAGAC CT AGT C AGC CT C T C T CACT C C 204 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 
CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2066 


Db 


2007 


Qy 


2041 


T GC C C CT ACT AT CT AT CAT G GAAT AAC AT C C AAGAAAGACAC CT T G CAT AT T CT T T C AGT 2100 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 
T G C C C C T AC TAT C TAT CAT G GAAT AAC AT C C AAGAAAGACAC C T T G CAT AT T C T T T CAG T 2126 


Db 


2067 


Qy 


2101 


TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 
1 1 1 1 1 1 N 1 M 1 1 1 1 1 1 1 1 1 1 1 M M 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 I I I I I I I I I I 
TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 218 6 


Db 


2127 


Qy 


2161 


AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M II I || | | | | || | | | | | | | 
AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 224 6 


Db 


2187 


Qy 


2221 


C AGT GAG CTCCTTCTTGGCT GAGC AGG C AT GGAG AC T GT AGGT T T C C AGAT T T C C T GAAA 22 8 0 
i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i ■ i i i i ■ ■ i , ... 

1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | 

CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2306 


Db 


2247 


Qy 


2281 


AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTC 2315 
1 M 1 1 1 1 1 1 1 1 1 1 1 I I | | | 1 1 1 1 1 1 1 II 1 1 1 1 II 1 
AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTC 2341 


Db 


2307 



RESULT 4 



BD123523 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 

COMMENT 



PAT 18-SEP-2002 



FEATURES 

source 



ORIGIN 



BD123523 2341 bp DNA linear 

Secretory protein or membrane protein. 
BD123523 

BD123523.1 GI:23218468 
JP 2002017376-A/32. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 2341) 

Ota,T., Isogai,T., Nishikawa, T . , Kawai,Y., Sugiyama, T. and 
Hayashi , K. 

Secretory protein or membrane protein 
Patent: JP 2002017376-A 32 22-JAN-2002; 
HELIX RESEARCH INSTITUTE 



Homo sapiens (human) 
JP 2002017376-A/32 
22-JAN-2002 

07-JUL-2000 JP 2000253173 

TOSHIO OTA,TAKAO I SOGAI , TETSUO NI SHI KAWA, YURI KAWAI , TOMOYASU 

SUGIYAMA, 

KOJI HAYASHI 



OS 
PN 
PD 
PF 
PI 
PI 
PI 
PC 

C12N15/09,C07K14/47,C07K16/18, C12N1/15, C12N1/19, C12N1/21, C12N5/ PC 
10, 

PC C12P21/02,C12Ql/68//C12P21/08,C12N15/00,Cl2N5/00 CC 
Secretory protein or membrane protein 
FH Key Location/Qualifiers 
FT CDS (94). .(1662). 

Location/Qualifiers 

1. .2341 

/organism =,, Homo sapiens" 
/rnol_type="genomic DNA" 
/db xref="taxon:9606" 



Query Match 99.6%; Score 2310.2; 

Best Local Similarity 99.9%; Pred. No. 0; 
Matches 2312; Conservative 0; Mismatches 



Qy 

Db 



DB 6; Length 2 341; 

3; Indels 0; Gaps 



0; 



1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I | | | | | | | | 
2 7 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 86 



Qy 

Db 



61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I M | | | | | | | | | | | | | | | | 
87 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 14 6 



Qy 

Db 

Qy 

Db 



121 GCTCTCAGAGGCTGCCAAAATCCTGACAATATCTACAGTAGGTGGAAGCCATTATCTACT 

I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
14 7 GCT C T C AGAG GC T GC CAAAAT C C T GACAAT AT C T ACAGT AG GT GGAAG C CAT TAT C T AC T 



181 



207 



GAT G GAC CGGGTTTCT C AGAT T C T T CAAGAT CAC GGT C AT AAT GT CAC CAT GCT TAAC C A 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAT G GAC C GG GT T T CT C AGAT T CT T CAAGAT CAC GGT CAT AAT GT CAC CAT G CT T AAC CA 



180 



206 



240 



266 



Qy 241 C AAAAG AG GT C C T T T TAT G C C AG AT T T T AAAAAG GAAGAAAAAT CAT AT C AAG T TAT C AG 30 0 

MINIMUM II I II M I I M I II I I II I I I I I I I I I I I I I I I I M || | | | | 

Db 267 CAAAAGAGGT CCTT TT AT GCCAGATTTTAAAAAGGAAGAAAAAT CAT AT CAAGTTAT CAG 326 

QY 301 TTGGCTTG C AC C T G AAG AT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 3 60 

M II I I I I I I II I I I I I I M I I I I I I I II I I I I I II I I I I I || I I I I | | | | | | | | | | | | | 
Db 327 TTGGCTTG C AC C T G AAG AT CAT C AAAGAG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 386 

Qy 361 AG AAAC T T TAG GT G GC AG AG GAAAAT T T GAAAAC T TAT T AAAT GT T C TAG AAT AC T T G G C 42 0 

M II I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | I I 

Db 387 AGAAAC T T TAG GT G G CAG AG GAAAAT T T GAAAAC T TAT T AAAT G T T C T AGAAT AC T T G G C 4 46 

Qy 421 GTT GCAGT GCAGT CATTTTTTAAATAGAAAGGATAT CATGGATTCCT TAAAGAAT GAGAA 4 80 

I I I I M M I I I I II I I I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I 
Db 447 GT T G C AGT GCAGT CAT T T T T T AAAT AGAAAGGAT AT CAT GGAT T C CT TAAAGAAT GAGAA 506 

Qy 4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

M II I I I I I I I II I I I I I I I I I I I I I I | | | | | | || || || | | | | | | | | | | | | | | | || | | | | 

Db • 507 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 566 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

N I N I M II I I I I I I I I I I I I I I I I I I I || I I | | | | || | | | | | | | | | | | | | || || | | || 

Db 567 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 62 6 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

M I I I II I I I I I I I I I I I I M I I II II I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 627 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 68 6 

Qy 661 G G G C C GAGT G AAG AAT T T T C T GAT G T T C T T TAG T T T C T G CAG GAG G C AAC A G C AC AT G C A 72 0 

I M I I I I I I I I I I I I I I I I I I I I || I M | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 687 G GG C C GAGT GAAGAATT T T CT GAT GT T CT T T AGT TT C T GCAGGAG GCAAC AGC AC AT GCA 746 

Qy 721 GT CT AC AT TT GACAAC AC CAT CAAG GAACATT T CAC AGAAGGC T CTAGGCC AGT TT T GT C 7 80 

M i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I 
Db 747 GT CT AC AT T T GACAACAC CAT CAAG GAACAT T T CACAGAAGGC T C TAGGC C AGT T T T GT C 8 06 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I 

Db 8 07 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 8 66 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I M I I I I I I I I I I I I I I I I I I | | | | | | | | | | | || | | | | | | | | | | || | | | | | | | | | | | | | | 

Db 8 67 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 92 6 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I M I I I I I I I I I I I I I I I I I I | | I | | | | I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 927 AGT AC CACAAGAC T T GGAGAACT T CAT T G C CAAGT T T GAG GACT CTGGTTTTGT C CTT GT 98 6 

Qy 9 61 G AC CTTGGGCTC CAT G GT G AAC AC C T GT C AGAAT C C G G AAAT CTT CAAG GAG AT GAAC AA 1020 
I M II II I I I I I I I I I I I I I I | I I | | | | | | | I I I I I I I I I I I I I I I II I I I I I I I 

Db 987 G AC CTTGGGCTC CAT G GT GAAC AC C T GT C AGAAT C C G G AAAT CTT CAAG GAG AT G AAC AA 1046 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

M M I M I I I I I I I I I I II I || I I | | | || || || || | | | | | | || | | | | | | | | || | 

Db 1047 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 110 6 

Qy 1081 AG AT GT C CAC C T G GC T G CAAAT GT GAAAAT T GT GGACT GGCTTCCT CAG AGT GACCT C C T 114 0 



Db 


1107 


1 1 1 1 II II 1 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 | | [| M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | 1 I 1 

AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 


1166 


Qy 


1141 


G G C T C AC C C AAG CAT CCGTCTGTTTGT C AC C C AC G G C G G G C AGAAT AG C AT AAT G GAG G C 

N M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I I I | | | | | | | | | | | | | | | | | | | | | | | | 

G GC T C AC C C AAGC AT CCGTCTGTTTGT C AC C CAC GG C G GGC AGAATAG CAT AAT G GAGG C 


1200 


Db 


1167 


1226 


Qy 


1201 


CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 

1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 M I I I M 1 M II 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 I | 1 1 1 

CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 


1260 


Db 


1227 


1286 


Qy 


1261 


GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 
1 N 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 
GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 


1320 


Db 


1287 


1346 


Qy 


1321 


GACATT GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT C CGCGGCAGT 

1 1 1 1 1 1 M M II 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | M II 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 
GACAT T GGC T CT TAAGAT GAAACAAAT CAT G GAAGACAAG AG AT AC AAGT C C GC G GC AGT 


1380 


Db 


1347 


1406 


Qy 


1381 


GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 
1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 


1440 


Db 


1407 


1466 


Qy 


1441 


GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I 1 1 1 i 1 1 1 1 1 1 1 1 1 1 
GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 


1500 


Db 


1467 


1526 


Qy 


1501 


GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 
1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GCCCTGGCATGAGCAGTACCTGCTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 


1560 


Db 


1527 


1586 


Qy 


1561 


GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 
1 II 1 1 II 1 1 1 1 1 M 1 II II 1 1 1 1 1 1 1 1 I I I I | | | M | || || | | || | | | 1 || 1 1 1 I 1 | 1 1 1 
GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 


1620 


Db 


1587 


1646 


Qy 


1621 


AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 
1 1 1 1 1 1 1 1 II 1 1 M II 1 1 1 1 1 1 II 1 1 1 1 I I I || | || | | | | | | | M II 1 1 II II 1 1 1 1 1 1 1 
AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 


1680 


Db 


1647 


1706 


Qy 


1681 


TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 
TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 


1740 


Db 


1707 


1766 


Qy 


1741 


TATCTCCTGTTTTCTTG7UVGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 
1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I I I I I || | | | | | | | | | | | 
TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 


1800 


Db 


1767 


1826 


Qy 


1801 


ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 
N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAATTCTTTCCAGTCCT 


1860 


Db 


1827 


1886 


Qy 


1861 


CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 

N 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 | | | | | | | | | | | | | | | | | || | | | | | | | | | | | | | | | | | | | | | | 

CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 


1920 


Db 


1887 


1946 


Qy 


1921 


TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 


1980 



I I I I M I I I I I I I I I I I I | | | | | | | | | | | | | | | | | M | | | | | | | | | | | | | | | | | || | | | | 



Db 


1947 


TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 


2006 


Qy 


1981 


CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 
1 M 1 1 1 1 1 1 1 I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | || | , | | | | 

CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 


2040 


Db 


2007 


2066 


Qy 


2041 


T G C C C CT AC TAT C TAT CAT G G AAT AAC AT C C AAGAAAG AC AC C T T G CAT AT T C T T T C AG T 

1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 I | | || | | | | | M | | | | | | | | | | | | | | | | 

T GC CC C TACT AT C TAT CAT GGAATAAC AT C CAAGAAAGAC AC CT T G CAT AT T CT T T C AGT 


2100 


Db 


2067 


2126 


Qy 


2101 


TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 
1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I I | | | | | | | | || | | | | | | || | | 
TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 


2160 


Db 


2127 


2186 


Qy 


2161 


AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 I I I | | | | | | | | | | | | | | | | | 
AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 


2220 


Db 


2187 


2246 


Qy 


2221 


CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 

1 1 1 1 1 I 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 ) j 1 1 1 1 i i i i i i i i i i i i i i i 

' 1 1 1 1 1 1 I II II f M M | 1 1 1 1 II 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 
CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 


2280 


Db 


2247 


2306 


Qy 


2281 


AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTC 2315 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
AAT AAAAGT T T ACAG C GT TAT C T CT C C C C AAC CT C 2341 




Db 


2307 
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AK075383 2341 bp mRNA linear PRI 03-SEP-2002 

Homo sapiens cDNA PSEC0073 fis, clone NT2RP2002934 , weakly similar 
to UD P -GLUCURONOSYLT RAN SFE RASE 2C1 MICROSOMAL (EC 2.4.1.17). 
AK075383 

AK075383. 1 GI : 227614 33 

oligo capping; fis (full insert sequence) . 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Ota,T., Nishikawa,T. , Suzuki , Y. , Kawai-Hio, Y. , Hayashi,K., 

Ishii,S., Saito,K., Yamamoto, J. , Wakamatsu,A. , Nagai,T., 

Nakamura,Y., Nagahari,K., Sugano,S. and Isogai,T. 

HRI human cDNA sequencing project 

Unpublished 

2 (bases 1 to 2341) 

Isogai,T. and Yamamoto, J. 

Direct Submission 

Submitted (20-MAR-2002) Takao Isogai, Helix Research Institute, 
Genomics Laboratory; 1532-3 Yana, Kisarazu, Chiba 292-0812, Japan 
(E-mail : genomics @hri . co. jp, Tel : 81-438-52-3975, Fax: 81-438-52-398 6) 
HRI human cDNA sequencing project; cDNA 5'- & 3 '-end one pass 
sequencing, clone selection and full insert sequencing: Helix 
Research Institute (supported by Japan Key Technology Center etc.); 
cDNA library construction: Institute of Medical Science, University 
of Tokyo, Laboratory of Genome Structure, Human Genome Center. 
Location/ Qualifiers 



source 1. .2341 

/organism="Homo sapiens" 

/mol__type="mRNA" 

/db_xref="taxon: 9606" 

/clone="NT2RP2002934" 

/cell_line="NT2" 

/ cell_type= ,, teratocarcinoma" 

/clone_lib="NT2RP2" 

/note="cloning vector: pME18SFL3~mRNA from NT2 neuronal 
precursor cells after 2-weeks retinoic acid (RA) 
induction" 
CDS 94. .1665 

/note="unnamed protein product" 
/ codon_start=l 
/protein_id="BAC11583. 1" 
/db_xref="GI :22761434" 

/ trans la tion="MAGQRVLLLVGFLLPGVLLSEAAKILTISTVGGSHYLLMDRVSQ 
I LQDHGHNVTMLNHKRGP FMPDFKKEEKS YQVT SWLAPEDHQREFKKS FDFFLEETLG 
GRGKFENLLNVLEYLALQCSHFLNRKDIMDSLKNENFDMVIVETFDYCPFLIAEKLGK 
PFVAILSTSFGSLEFGLPIPLSYVPVFRSLLTDHMDFWGRVKNFLMFFSFCRRQQHMQ 
STFDNTIKEHFTEGSRPVLSHLLLKAELWFINSDFAFDFARPLLPNTVYVGGLMEKPI 
KPVPQDLENFIAKFEDSGFVLVTLGSMVNTCQNPEIFKEMNNAFAHLPQGVIWKCQCS 
HWPKDVHLAANVKIVDWLPQSDLLAHPSIRLFW 

DQPENMVRVEAKKFGVSIQLKKLKAETIALKMKQIMEDKRYKSAAVAASVILRSHPLS 
PTQRLVGWIDHVLQTGGATHLKPYVFQQPWHEQYLLDVFVFLLGLTLGTLWLCGKLLG 
MAVWWLRGARKVKET " 

ORIGIN 



Query Match 99.6%; Score 2310.2; DB 9; Length 2341; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2312; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 



Qy 


1 


AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 
1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II I I I || I I M 1 1 1 1 1 1 II 
AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 


60 


Db 


27 


86 


Qy 


61 


AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | | || | | | | | 
AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 


120 


Db 


87 


146 


Qy 


121 


GCT CT CAGAGGCT GCCAAAAT C CTGACAATATCTACAGT AGGT GGAAGCCAT T ATCTACT 

HI 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

G CT C T C AG AG G C T G C C AAAAT C C T GAC AAT AT C T AC AGT AG GT G GAAG C CAT TAT C T AC T 


180 


Db 


147 


206 


Qy 


181 


GATGGACC GGGT TT CT CAGATT CTT CAAGAT CACGGT CATAAT GT CAC C AT GCT TAAC CA 
1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 I I | | | M | | || | | | | | | M 
GAT GGAC CGGGTTTCT C AGAT T CT T CAAGAT CAC G GT CATAAT GT CAC CAT GCT TAAC C A 


240 


Db 


207 


266 


Qy 


241 


C AAAAGAG GT C C T T T TAT G C C AGAT T T T AAAAAG GAAGAAAAAT CAT AT CAAGT T AT C AG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | | | | | | | | | | | | | || 
CAAAAGAGGTCCTTTTAT GCCAGATTTTAAAAAGGAAGAAAAATCATAT CAAGTTAT CAG 


300 


Db 


267 


326 


Qy 


301 


TTGGCTTG CAC C T GAAG AT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 

1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 


360 


Db 


327 


386 



Qy 



361 AGAAACTTTAGGTGGCAGAGGAAAATTTGAAAACTTATTAAATGTTCTAGAATACTTGGC 420 



Db 387 AGAAACT T TAG GT G GC AGAG G AAAAT T T GAAAACT T AT T AAAT GT T C T AGAAT AC T T G G C 4 46 

Qy 421 GTT GCAGT GCAGTCATTT TTTAAATAGAAAGGATAT CAT GGATTCCTTAAAGAAT GAGAA 480 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 447 GTT GCAGT GCAGT CAT TTT T TAAAT AGAAAGGATAT CAT GGATT C CTTAAAGAAT GAGAA 506 

Qy 481 C T T C GAC AT GGT GATAGT T GAAACT T T T GACT ACT GT CCTTTCCT GAT T GCT GAGAAGC T 540 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 507 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 566 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 567 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 62 6 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 
Db 627 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 68 6 

Qy 661 GGGC C GAGT GAAGAAT T T T C T GAT GT T CTT T AGT TT CT GC AG GAG GCAACAG CAC AT GC A 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I 
Db 687 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 74 6 

Qy 721 GT C T AC AT T T GACAACAC CAT CAAGGAAC AT T T CAC AGAAG GCT C T AGGC CAGT TT T GT C 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 747 GT CTACATTTGACAACAC CAT CAAGGAACATT TCACAGAAGGCTCTAGGCCAGT TTT GT C 8 06 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I II 

Db 8 07 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 8 66 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 90 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 8 67 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 926 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 92 7 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGAGGACTCTGGTTTTGTCCTTGT 98 6 

Qy 961 GACCTTGGGCT CCAT GGT GAACAC CT GT CAGAAT CC GGAAATCTT CAAGGAGAT GAACAA 1020 

I M I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 987 GAC CTTGGGCTC CAT GGT GAACAC C T GT CAGAAT C C G G AAAT CTT C AAG GAG AT GAACAA 1046 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I II I I II II 

Db 1047 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 110 6 

Qy 10 81 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I 
Db 1107 AGAT GT C CAC CT GG C T GC AAAT GT GAAAAT T GT G GACT GGCTTCCT C AGAGT GAC CT C C T 1166 

Qy 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I 
Db 1167 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1226 

Qy 1201 CAT C CAGC AT GGT GT G CC CAT G GT GGGGAT CCCTCTCTTTG GAGAC C AG C CT GAAAAC AT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 



Db 


1227 


CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 


1286 


Qy 


1261 


GGT CC GAGT AGAAGC CAAAAAGT T T GGT GT TT CT AT T CAGTTAAAGAAGCT CAAGGC AGA 

1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I | M 1 II II M 1 1 II 1 1 1 1 1 

GGT C C GAGT AGAAGC CAAAAAGT T T G GT GT T T C TAT T C AGT T AAAGAAG C T C AAG GC AG A 


1320 


Db 


1287 


1346 


Qy 


1321 


GACATT GGCTCTTAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGT CCGC GGCAGT 
1 1 1 M 1 1 1 1 1 1 1 1 1 I I I I I 1 I I I I I I I I I | | | | | | | M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I 
GACATT GGCTCTTAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGT CCGC GGCAGT 


1380 


Db 


1347 


1406 


Qy 


1381 


GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 I 1 1 1 1 I I I | | I I | | | | | | | | | | | 
GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 


1440 


Db 


1407 


1466 


Qy 


1441 


GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I I | | | | | | | | 
GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 


1500 


Db 


1467 


1526 


Qy 


1501 


GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 I I I I I I | | 1 1 1 
GCCCTGGCATGAGCAGTACCTGCTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 


1560 


Db 


1527 


1586 


Qy 


1561 


GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 
GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 


1620 


Db 


1587 


1646 


Qy 


1621 


AAAG GT GAAGGAGAC ATAAGG C CAG GT GC AG CCTTGGCGGGGTCTGTT T GGT GG G C GAT G 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 
AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 


1680 


Db 


1647 


1706 


Qy 


1681 


TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 
1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I I I 
TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 


1740 


Db 


1707 


1766 


Qy 


1741 


TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II II 1 1 1 1 1 1 I I I I I I I I I I I I | 
TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 


1800 


Db 


1767 


1826 


Qy 


1801 


ATTTT GCT AC AAATT CAT C CTT ACT AGCT C CT GC CT GCTAGCAGAAAT CTT T C C AGT C CT 

M 1 1 ! 1 II 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | I | M | | | | | | | M | | | | | M | | | | | | 1 1 1 1 1 1 1 

ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAATTCTTTCCAGTCCT 


1860 


Db 


1827 


1886 


Qy 


1861 


CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 
1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I I | | | || | | | | | | | 
CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 


1920 


Db 


1887 


1946 


Qy 

Db 


1921 
1947 


TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 


1980 
2006 


Qy 


1981 


CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 

1 1 1 1 1 1 1 1 1 1 i 1 i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i j i i i i i i i i i i i i 
1 1 M 1 1 1 1 1 It M 1 II 1 II 1 II 1 1 1 1 1 II II II 1 1 1 1 | | | || | | | || | | | | | | | | | | | | | 

CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 


2040 


Db 


2007 


2066 


Qy 


2041 


T G C C C C T AC TAT CT AT CAT G GAAT AAC AT C C AAGAAAG AC AC C T T G CAT AT T C T T T C AGT 

1 M II 1 1 1 1 1 1 1 I I I I 1 I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TGCCCCTACTATCTAT CATGGAATAACAT CCAAGAAAGACACCTT GCATATT CTTTCAGT 


2100 


Db 


2067 


2126 



Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

1 1 ! 1 1 I I I I I I I I I I I I I I II 1 1 I I 1 1 1 1 I I.I I I 1 1 1 I I I I I I II I I I I I I I II I I | l I I 

Db 2127 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 218 6 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M M I I I I II 

Db 218 7 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 224 6 

Qy 2221 C AGT GAG CTCCTTCTTGGCT GAG C AG G CAT G GAGAC T GT AGGT T T C C AGAT T T C CT G AAA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2247 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2306 

Qy 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTC 2315 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2307 AAT AAAAGT T T AC AG C GT TAT CT C T C C C C AAC C T C 2341 
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AX548037 2944 bp DNA linear PAT 26-NOV-2002 

Sequence 13 from Patent WO02066654. 

AX548037 

AX54 8037. 1 GI : 2 5813133 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Astromof f , A. , Au-Young,J., Baughn,M.R., Ding,L., Duggan,B.M., 

Forsythe, I. J. , Gietzen, K. J . , Griff in, J. A. , Lee,E.A., Lu, Y. , 

Richardson, T.W. , Ring,H.Z. , San j anwala,M.M. , Swarnakar,A. , 

Walia,N.K., Warren, B. A., Xu,Y., Yue, H. and Zebar jadian, Y. 

Drug metabolizing enzymes 

Patent: WO 02066654-A 13 29-AUG-2002; 

Incyte Genomics, Inc. (US) 

Location/Qualifiers 

1. .2944 

/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db_xref="taxon: 9606" 
/note="Incyte ID No: 7486594CB1 M 



Query Match 90.6%; Score 2102.8; DB 6; Length 2944; 

Best Local Similarity 95.5%; Pred. No. 0; 

Matches 2216; Conservative 0; Mismatches 2; Indels 102; Gaps 1; 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I I I I I I I I I I I I I I I | | | | I I I | | | | | I I I I I I I I I I I I I I I I I I I I I I I I 
Db 204 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 263 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I I I I I I I I I I I M I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 64 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 323 



Qy 121 GCTCTCAGAGGCTGCCAAAATCCTGACAATATCTACAGTAGGTGGAAGCCATTATCTACT 180 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 324 GC T CT C AGAGGCT G C C AAAAT CC T GAC AAT AT C TAG AG T 3 62 

QY 181 GAT GGAC CGGGTTTCT CAGAT T C T T CAAGAT C AC G GT CAT AAT GT C AC CAT G CT T AAC C A 24 0 
Db 363 362 

Qy 241 C AAAAGAG GT C C T T T TAT G C CAGAT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT C AG 300 

I I I M M I I I I I I I I I I I I | | | I II I I I I I I I I I 

Db 363 AGAT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT CAG 4 01 

Qy 301 TTGGCTTG C AC C T GAAG AT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 360 

I I I I M I I I I I I I I I I I II I I I I I I I I I II I I I M I I I I I I I M I I I I I I I I I I I I I I I I 

Db 4 02 T T GGC T T GC AC CT GAAGAT CAT C AAAGAGAAT T T AAAAAGAGT T TT GATT T C T T T CT G GA 4 61 

Qy 361 AGAAACT T T AGGT GGCAGAGGAAAATTT GAAAACTT AT TAAAT GTT CT AGAAT ACTT GGC 42 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | || | | | | | | | | | | | I | || || | | | 

Db 4 62 AGAAACT T T AG GT GGC AGAGGAAAAT T T GAAAAC T TAT TAAAT GTT CT AGAAT AC T T G GC 521 

Qy 421 GT T GC AGT GC AGT CAT T T T T T AAAT AGAAAGG AT AT CAT G GAT T C C T T AAAGAAT G AGAA 4 8 0 

I I I I M I I I I I I I I I I I I II I II I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 522 GT T GCAGT GC AGT C ATT TT T TAAAT AGAAAGGAT AT CAT G GAT T C CT TAAAGAAT GAGAA 581 

Qy 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

M I i I i 1 1 1 i I i I i 1 1 i li l 1 1 1 1 1 1 1 1| i i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i | | 1 1 1 1 1 1 1 1 1 

Db 582 CT T C GAC AT GGT GAT AGTT GAAACT T T T GAC TACT GT C CT TT CCT GAT T GCT GAGAAG C T 641 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | || | || | | | | 

Db 642 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 701 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 702 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 761 

Qy 661 GGGC C GAGT GAAGAATT TT CT GAT GTT CTTTAGT TT CT GCAGGAGGCAACAGCACAT GCA 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 7 62 GGGCCGAGTGAAGAATTTTCT GAT GTT CTTTAGTTTCT GCAGGAGGCAACAGCACAT GCA 821 

Qy 721 GT C T AC AT T T GAC AAC AC CAT C AAG G AAC AT T T C AC AGAAG G CT C TAG G C C AGT T T T GT C 78 0 

I M I I I I I I I I I I I I I II II I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 822 GT CTACATTTGACAACACCAT CAAGGAACATT T CACAGAAGGCT CTAGGCC AGT TTT GT C 881 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I || I I I I I I I 
Db 8 82 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 941 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 90 0 

I M I I I I I I I I I I I I II I I I I || | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

Db 942 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 1001 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 10 02 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 10 61 

Qy 961 GACCTTGGGCT CCAT GGT GAACACCT GT C AGAAT CC GGAAAT CTT CAAGGAGATGAACAA 1020 



1062 G AC CTTGGGCTC CAT G GT G AAC AC C T G T C A G AAT C C G G AAAT C T T C AAG GAG AT G AAC AA 1121 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

I I I I I I I I M I I I I I I II I I I I I I I I I I I I I | I | | | M I I II I I I I I I I I II I I I | | | M 
1122 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1181 

1081 AGAT GT C CAC CT GGCT GCAAAT GT GAAAAT T GT GGACT GGCTT CCT CAGAGT GAC CT CCT 114 0 

I M I I I II I I I I I M I I I I I I M I I M I I I I I I I I I I I I I M I I | | | | | | || | | | | | | | | 
1182 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1241 

1141 GGCT CAC C CAAGC AT CCGTCTGTTTGT CAC C CAC G GC G GGC AGAAT AG CAT AAT G GAGG C 1200 

I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I | | | | | | | || | | 
1242 GGCT CAC C CAAGC AT C C GT CT GT T T GT CAC C CAC GGC G G GCAGAAT AG CAT AAT G GAGGC 1301 

1201 CAT C C AG CAT GGTGTGCC CAT G G T G G G GAT CCCTCTCTTTG GAG AC C AG CCT G AAAA C AT 1260 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I | I | I | | | | | | | | | | || | | | | | | | | | | | | | | | 
1302 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1361 

12 61 G G T C C GAGT AG AAG C C AAftAAGT TTGGTGTTTC TAT T C AG T T AAAGAAG C T C AAG G C AG A 132 0 

I I I I I I I I I II I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1362 GG T C C G AGT AGAAG C C AAAAAGT TTGGTGTTTC TAT T C AG T T AAAGAAG C T C AAG G C AG A 1421 

1321 GACAT T GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGT C C GC GGCAGT 1380 

I I I I I I I I I I I M I I I II I I I I I I I I I I I | I | | | | | || | | | | | | | | | | | | | | | | | | | | | | 

1422 GACATT GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGAT AC AAGT CCGC GGCAGT 1481 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I I | | | | || II I I II 
14 82 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1541 

1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1542 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1601 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I | I I I I I I I I I I I 
1602 GCCCTGGCATGAGCAGTACCTGCTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1661 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1662 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1721 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I II I I I I I II I I | I | | | | | | | || | | | 
1722 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 17 81 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I 

17 82 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1841 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I | | | | | | | I I I | 

1842 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1901 

18 01 ATTTTGCTACA?ATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I I I I M I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I || I I II II II I I I II 



Db 



1902 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAATTCTTTCCAGTCCT 1961 



Qy 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

M I II I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | M I I I II I I I I I I M I I I I I I I I 
Db 1962 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 2 021 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | || | | | | | | 
Db 2022 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 2 081 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2040 

I N I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I 

Db 2082 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2141 

Qy 2041 T GCC C CTACT AT CT AT CAT GGAATAACAT C CAAGAAAGAC AC CT T GCAT AT T CTT T CAGT 2100 

I I I M I I M I I I I I I I I I III I I I I M I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | 

Db 2142 T GCCC CTACTAT CTAT CAT GGAATAACAT C CAAGAAAGACACCTT GCATAT T CTTT CAGT 2201 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 22 02 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2261 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | 
Db 22 62 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2321 

Qy 2221 CAGT GAGC T CCTTCTTGGCT GAG CAG GC AT G GAG AC T GT AG GT T T C C AGAT T T C C T GAAA 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I 
Db 2322 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 23 81 

Qy 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 

I I I M I I I II II I I I I I I I I I I I I II I I I | | | || | | | | | | 
Db 2382 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2421 
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AX359921 2082 bp DNA linear PAT 13-FEB-2002 

Sequence 1 from Patent WO0202774. 

AX359921 

AX359921 . 1 GI : 18 675563 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Leiby,K.R., Cook, W.J. and Spaltmann,F. 

32626, a human udp-glycosyltransf erase and uses thereof 
Patent: WO 0202774-A 1 10-JAN-2002; 
Millennium Pharmaceuticals, Inc. (US) 

Location/ Qualifiers 

1. .2082 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 
145. .1716 



/note="unnamed protein product" 
/codon_start=l 
/protein_id="CAD23353. 1" 
/db_xref="GI: 18675564" 
/db_xr e f = 11 REMTREMBL : CAD 2 3353" 

/translation="MVGQRVLLLVAFLLSGVLLSEAAKILTISTLGGSHYLLLDRVSQ 
ILQEHGHNVTMLHQSGKFLIPDIKEEEKSYQVIRWFSPEDHQKRIKKHFDSYIETALD 
GRKESEALVKLMEIFGTQCSYLLSRKDIMDSLKNENYDLVFVEAFDFCSFLIAEKLVK 
PFVAILPTTFGSLDFGLPSPLSYVPVFPSLLTDHMDFWGRVKNFLMFFSFSRSQWDMQ 
STFDNTIKEHFPEGSRPVLSHLLLKAELWFVNSDFAFDFARPLLPNTVYIGGLMEKPI 
KPVPQDLDNFIANFGDAGFVLVAFGSMLNTHQSQEVLKKMHNAFAHLPQGVIWTCQSS 
HWPRDVHLATNVKI VDWL PQ S DLLAH P S I RL FVTHGGQN S VMEAI RHGVPMVGL PVNG 
DQHGNMVRWAKNYGVSIRLNQVTADTLTLTMKQVIEDKRYKSAWAASVILHSQPLS 
PAQRLVGWIDHILQTGGATHLKPYAFQQPWHEQYLIDVFVFLLGLTLGTMWLCGKLLG 
WARWLRGARKVKKT " 



ORIGIN 



Query Match 55.2%; Score 1281.6; DB 6; Length 2082; 

Best Local Similarity 85.9%; Pred. No. 0; 

Matches 1422; Conservative 0; Mismatches 234; Indels 0; Gaps 0; 

CCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGAAGTGAG 66 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I | | | M I II I I I I I I I I 
CCTTAGCCCGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCTGCTTCTGTGGAAGTGAG 143 

CATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCTGCTCTC 12 6 
I I I I > I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CATGGTTGGGCAGCGGGTGCTGCTTCTAGTGGCCTTCCTTCTTTCTGGGGTCCTGCTCTC 203 

AGAGGCT GC CAAAAT C CT GAC AAT AT CT ACAGT AGGT GGAAGCCATT AT CTACT GAT GGA 18 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

AGAG GCT G C CAAAAT C C T GACAATAT CT ACACT GGGT G GAAG C CAT T AC CTACT GT T GGA 2 63 

CCGGGTTTCT C AGAT T C T T C AAGAT C AC G GT CAT AAT GT C AC CAT G C T T AAC C AC AAAAG 246 
I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I II I I | | I I I II I I 
C C GGGT GT CT CAGAT T CT T CAAGAG CAT G GT CAT AAT GT GACT AT G C T T CAT CAGAGT GG 323 

AG GT C C T T T TAT G C C AG AT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT T AT C AGT T G G C T 306 
I HI M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 

AAAGTT TT T GAT C C CAGAT AT TAAAGAGGAG GAAAAAT CAT AC CAAGT T AT C AGGT G GT T 383 

T G C AC C T GAAG AT CAT C AAAGAGAAT T T AAAAAGAGT T T T GAT TTCTTTCTG GAAGAAAC 366 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I Ml II 

T T C AC C T GAAGAT CAT C AAAAAAGAAT T AAGAAG CAT T T T GAT AG C T AC AT AG AAAC AG C 4 43 

T T TAG GT G GC AG AG G AAAAT T T GAAAAC T TAT T AAAT GT T C T AGAAT AC TTGGCGTTG C A 426 

M I I I II I I I I I I I I I I I II I I I I I I I | I M I I II 
AT T GGAT GGCAGAAAAGAAT CT GAAGCCCTT GTAAAGCTAAT GGAAATATTTGGGACT CA 503 

GT GC AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C CT T AAAGAAT GAGAAC T T C G A 4 8 6 

I I I III I I I I I I I I I I I I I I I I I I I | | | | M I I I I I II I I I I II 

AT GTAGTT ATTT GCTAAGCAGAAAGGAT AT AAT GGAT TCCTT AAAGAAT GAGAACTAT GA 563 

CATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCTTGGGAA 54 6 
I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 



Qy 


7 


Db 


84 


Qy 


67 


Db 


144 


Qy 


127 


Db 


204 


Qy 


187 


Db 


264 


Qy 


247 


Db 


324 


Qy 


307 


Db 


384 


Qy 


367 


Db 


444 


Qy 


427 


Db 


504 


Qy 


487 


Db 


564 



Qy 54 7 GCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCC 606 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I M | | | | | | | 
Db 624 ACCATTTGTGGCCATTCTTCCCACCACATTCGGCTCTTTGGATTTTGGGCTACCAAGCCC 683 

Qy 607 CTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCG 666 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I M I 
Db 684 CTTGTCTTATGTTCCAGTATTCCCTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCG 743 

QY 667 AGT G AAG AAT T T T C T GAT G T T C T T TAG T T T C T G C AG GAG G C AAC AG C AC AT G C AG T C T AC 726 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I Ml I I I I I I I I I I I I I I 
Db 744 AGT GAAGAAT T T T C T GAT G T T C T T T AGT T T C T C C AG GAG C C AAT G G G AC AT G C AGT C T AC 803 

Qy 727 AT T T GAC AACAC CAT CAAG GAACATT T CAC AGAAGG CT CT AG GC C AGT T T T GT CT CAT CT 7 86 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I | | | I I I I I I I I 
Db 8 04 AT T T GAC AACAC CAT CAAG GAGCAT T T C C CAGAAGG CT CT AG GC C AGT T T T GT C T C AT CT 8 63 

Qy 7 87 TCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCTCGACC 84 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II 
Db 8 64 TCTACTGAAAGCAGAGTTGTGGTTTGTTAACTCTGATTTTGCCTTTGATTTTGCCCGGCC 923 

Qy 847 TCTGCTTCC CAACAC T GT T TAT GT T GGAG G CT T GAT GGAAAAAC CT AT T AAAC C AGT AC C 906 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | I I I I I I 
Db 924 CCTGCTTCC CAACACT GT TTAT AT T GGAG G CT T GAT GGAAAAAC C TAT T AAAC C AGT AC C 983 

Qy 907 ACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGACCTT 9 66 

i I i i I i i i I I I I I i I I I i i I I i I i i I I I I I i i i I I II I I I I I I ! I I I ] I I I I I 
Db 984 ACAAGACTTGGACAACTTCATTGCCAACTTTGGGGATGCAGGGTTTGTCCTTGTGGCCTT 1043 

Qy 967 G G G C T C CAT G GT G AAC AC C T G T C AG AAT C C G G AAAT C T T CAAG GAG AT GAAC AAT G C C T T 102 6 

I I I I I I I I I I II I I I II I I I I I I I I I || I I I I | | | | | | | | M I M I I I 

Db 1044 T GGCT C CAT GT T GAAC AC CC AT CAGT C C C AG GAAGT C CT CAAGAAGAT G C ACAAT GC CT T 1103 

Qy 1027 T GCT CAC CT AC C C C AAG GGGT GAT AT G GAAGT GT CAGT GT T C T CAT T GG C C C AAAGAT GT 108 6 

IN I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I Ill 

Db 1104 T G C C CAC C T C C CT CAAG GAG T GAT AT G GAC AT G T C AG AGT T C T CAT T G G C C C AG AG AT GT 1163 

Qy 1087 CCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCA 1146 

II M I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | M I I I I I I I I I I I I 

Db 1164 T CAT T T G GC CAC AAAT GT GAAAAT T GT GGAC T GGCT T C CT C AGAGT G AC CTCCTGGCT C A 1223 

Qy 114 7 C C CAAG CAT CCGTCTGTTTGT CAC C CAC G G C G GG C AGAAT AGC AT AAT G G AG GC CAT CCA 1206 

IN I I I I I I I I I I I I II II I I I I I I I I I M I I II I I I I M I I I I I 

Db 1224 CCCCAGCATCCGTCTTTTTGTCACTCATGGTGGGCAGAACAGCGTAATGGAGGCCATCCG 12 83 

Qy 1207 GCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATGGTCCG 1266 

I I I I I I I I M I I III II I I I I I I II I I I I | I I | | || 

Db 1284 T CAT GGTGTGCC CAT G G T G G GAT T AC C AG T C AAT G GAG AC C AG CAT G G AAAC AT G G T C C G 1343 

Qy 12 67 AGT AG AAG C CAAAAAGT TTGGTGTTT CT AT T C AGT T AAAGAAG CT CAAG GC AGAGAC AT T 132 6 

I I M I i I I M I I I I [ I I I I I I I I | | I | I | | | | Mill I I I I I I I I 
Db 134 4 AGTAGT AGC CAAAAATT AT GGT GT CT CTAT CCGGTT GAAT CAGGT CACAGC C GACAC ACT 14 03 

Qy 1327 GG CT C T T AAGAT GAAAC AAAT C AT GGAAGACAAGAGAT ACAAGT C C GC GG C AGT G GCT G C 1386 

I I INI I I I I II I I I I I I I I I I I I I I I I I I I II I I I II II I I I I I I II 
Db 14 04 GACACT T AC AAT GAAACAAGT C AT AGAAGACAAGAG GT ACAAGT C G G CAGT G GT GG C AG C 14 63 

Qy 1387 CAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGGATTGA 1446 



D b 14 64 CAGTGTCATCCTGCACTCTCAGCCCCTGAGCCCCGCACAGCGGCTGGTGGGCTGGATCGA 152 3 

Qy 1447 CCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCAGCCCTG 150 6 

MM M M M M M I I I I I M M M I M M M M M M I M Ml M I M M I I I 

°k 1524 CCACATCCTCCAGACTGGGGGAGCGACGCACCTCAAGCCCTATGCCTTCCAGCAGCCTTG 1583 

Qy 1507 GCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGGGACTCT 1566 

I M I M I M M M M I II I I I I I I II I II I I I I I I I I I I I I I I I I I I I I ill i 

Db 1584 GCATGAGCAGTACCTCATTGATGTCTTTGTGTTTCTGCTGGGGCTCACTCTGGGCACTAT 1643 

Qy 1567 ATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAGAAAGGT 162 6 

I I M M I M M M I I M I I I M I III I I II I I M I M M M I M M I Mill 

Db 1644 GTGGCTTTGTGGGAAGCTGCTGGGTGTGGTGGCCAGGTGGCTGCGTGGGGCCAGGAAGGT 1703 

Qy 1627 G AAG G AG AC AT AAG G C C AG G T G C AG CCTTGGCGGGG 1662 

M I I II II M I I M II II I I II II II I II 
Db 1704 GAAGAAGACAT GAG GCT AGGT GT AGCC T T G GGT GAG 1739 
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AX155211 
Sequence 
AX155211 
AX155211. 



CDS 



2797 bp 
from Patent WO0138505. 

GI : 14536690 



DNA 



linear 



PAT 22-JUN-2001 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Adler,D.A., Dong, D . L . , Pownder,S., Gao,Z. and Conklin, D . C . 

Secreted protein, zalpha37 

Patent: WO 0138505-A 1 31-MAY-2001; 

ZymoGenetics, Inc. (US) 

Location/Qualifiers 

1. .2797 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 
119. .1690 

/note="unnamed protein product" 
/ codon_start=l 
/protein_id-"CAC42674 .1" 
/db_xref="GI : 14536691" 
/ db_xref ="REMTREMBL : CAC42 67 4 " 

/ trans lation="MVGQRVLLLVAFLLSGVLLSEAAKILTISTLGGSHYLLLDRVSQ 
I LQEHGHNVTMLHQS GKFLI PDI KEEEKS YQVI RWFS PEDHQKRI KKHFDSYI ETALD 
GRKESEALVKLMEIFGTQCSYLLSRKDIMDSLKNENYDLVFVEAFDFCSFLIAEKLVK 
PFVAILPTTFGSLDFGLPSPLSYVPVFPSLLTDHMDFWGRVKNFLMFFSFSRSQWDMQ 
STFDNTIKEHFPEGSRPVLSHLLLKAELWFVNSDFAFDFARPLLPNTVYIGGLMEKPI 
KPVPQDLDNFIANFGDAGFVLVAFGSMLNTHQSQEVLKKMHNAFAHLPQGVIWTCQSS 
HWPRDWLATNVKIVDWLPQSDLLAHPSIRLFVTHGGQNSVMEAIRHGVPMVGLPVNG 
DQHGNMVRWAKNYGVSIRLNQVTADTLTLTMKQVIEDKRYKSAWAASVILHSQPLS 
PAQRLVGWIDHILQTGGATHLKPYAFQQPWHEQYLIDVFVFLLGLTLGTMWLCGKLLG 
WARWL RGARKVKKT " 



ORIGIN 



Query Match 55.2%; Score 1281.6; DB 6; Length 2797; 

Best Local Similarity 85.9%; Pred. No. 0; 

Matches 1422; Conservative 0; Mismatches 234; Indels 0; Gaps 0; 



Qy 


7 


CCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGAAGTGAG 

1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 II II MINIM 

CCTTAGCCCGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCTGCTTCTGTGGAAGTGAG 


66 


Db 


58 


117 


Qy 


67 


CATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCTGCTCTC 

Mill II II II II 1 II II 1 1 II II II 1 1 1 1 1 M 1 II 1 1 1 1 II II Mill 

CATGGTTGGGCAGCGGGTGCTGCTTCTAGTGGCCTTCCTTCTTTCTGGGGTCCTGCTCTC 


126 


Db 


118 


177 


Qy 


127 


AGAGGCT GCCAAAATC CT GACAATAT CT ACAGTAGGT GGAAGC CATTATCTACT GAT GGA 18 6 

1 M M M M 1 M 1 M 1 II 1 II II M 1 II 1 1 1 1 1 1 1 II M II 1 II M 1 1 1 II 1 1 1 1 1 

AGAG GCTGC CAAAAT C CT GACAATAT C T AC ACT GG GT GGAAGC CAT T ACCT ACT GT T GGA 237 


Db 


178 


Qy 


187 


CCGGGTTTCT CAGAT T CT T CAAGAT C AC G GT C AT AAT GT C AC CAT G CT T AAC C AC AAAAG 

1 1 1 M 1 1 1 1 1 1 1 1 1 II 1 II II 1 1 II 1 1 1 II 1 1 II M II 1 II 1 1 1 1 1 1 I I 

CCGGGTGTCT CAGAT T C T T C AAGAG CAT GGT CAT AAT GT GACT AT GCT T CAT CAGAGT G G 


246 


Db 


238 


297 


Qy 


247 


AG GT C CT T T TAT GC CAGAT TT TAAAAAG GAAGAAAAAT CAT AT CAAGT TAT C AGT T G GCT 

1 Ml II MUM II 1 II II 1 1 1 1 1 1 II 1 1 M 1 1 II II 1 1 1 1 1 1 Ml 1 

AAAGT T T T T GAT C C CAGAT AT T AAAGAG GAGGAAAAAT CAT AC CAAGT TAT C AG GT G GT T 


306 


Db 


298 


357 


Qy 


307 


T G C AC C T G AAG AT CAT C AAAG AG AAT T TAAAAAG AGT T T T GAT TTCTTTCTG GAAGAAAC 

1 1 1 1 1 II II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II II 1 1 II MM II 

TT CAC CT GAAGAT CAT CAAAAAAGAATT AAGAAGCATTT T GAT AGCTACATAGAAAC AGC 


366 


Db 


358 


417 


Qy 


367 


T T TAG GT G G C AG AG G AAAAT T T G AAAAC T TAT T AAAT GT T C TAG AAT AC TTGGCGTTG C A 42 6 
i i i i i i i i i i i i i i i i i i i i i ii 


Db 


418 


1 1 MM 1 1 1 i I II [ 1 11 

AT T GGAT G G CAGAAAAGAAT C T GAAG C C CT T GT AAAG CTAAT G GAAAT AT T T G GGACT C A 


477 


Qy 


427 


GT G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT G AGAAC T T C G A 

M Ml II II 1 II 1 II 1 II II 1 1 1 1 1 1 1 1 1 1 II II II II 1 1 1 1 II II 1 1 M 

AT GT AGT TAT T T G CT AAG C AGAAAG GAT AT AAT G GAT T C C T T AAAGAAT GAGAACTAT GA 


486 


Db 


478 


537 


Qy 


487 


CATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCTTGGGAA 
1 1 1 1 1 1 1 M 1 1 1 M 1 M 1 1 II 1 1 1 1 II II II 1 1 1 II 1 1 1 1 1 1 1 II 1 III 
TCTGGTATTTGTTGAAGCATTTGATTTCTGTTCTTTCCTGATTGCTGAGAAGCTTGTGAA 


546 


Db 


538 


597 


Qy 


547 


GCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCC 

1 1 M 1 1 1 1 II II II II M 1 1 1 1 1 1 II 1 II 1 1 1 1 M 1 1 1 1 1 1 1 M II 1 1 1 1 1 Ml 

ACCATTTGTGGCCATTCTTCCCACCACATTCGGCTCTTTGGATTTTGGGCTACCAAGCCC 


606 


Db 


598 


657 


Qy 

Db 


607 
658 


CTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCG 
1 1 1 1 1 M II 1 II II 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 M 1 1 1 II II 1 1 II M 1 
CTTGTCTTATGTTCCAGTATTCCCTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCG 


666 
717 


Qy 


667 


AGT GAAG AAT T T T C T GAT GT T C T T T AGT T T CT G CAGGAG G C AAC AG CAC AT G C AGT CT AC 

1 1 M II II II II II 1 II M 1 II M II 1 1 1 1 1 1 1 1 1 1 II III 1 1 1 II 1 1 1 1 II 1 II 

AGT GAAGAAT T T T CT GAT GT T C T T T AGT T T C T C C AG GAG C C AAT G G G AC AT G C AGT C T AC 


726 


Db 


718 


777 


Qy 


727 


ATT T GAC AACAC CAT CAAGGAAC AT T T C AC AGAAGGCT C T AG GC CAGT T T T GT CT CAT C T 

1 II M 1 M M M II II M 1 M II 1 1 II 1 1 1 1 1 1 1 1 II 1 II II II 1 1 1 II 1 M 1 1 II 1 1 

AT T T GAC AAC AC CAT C AAG GAG CAT T T C C C AGAAG GCT C T AG G C C AG TTTTGTCT CAT C T 


786 


Db 


778 


837 



Qy 


787 


TCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCTCGACC 

M I.I 1 1 1 1 1 1 1 1 1 1 1 1 1 I | I I I I | 1 1 1 | | 1 1 | | | 1 1 1 1 1 1 1 I I 1 II I 1 1 1 1 II II 

TCTACTGAAAGCAGAGTTGTGGTTTGTTAACTCTGATTTTGCCTTTGATTTTGCCCGGCC 


846 


Db 


838 


897 


Qy 


847 


TCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACCAGTACC 
1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 I I || | | | | | M | I | | | | | | | | | | | | | | | | | | | | | | 
CCTGCTTCC C AAC AC T GT T TAT AT T G GAG G C T T GAT G G AAAAA C C TAT T AAAC C AG T AC C 


906 


Db 


898 


957 


Qy 


907 


ACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGACCTT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 MM 
ACAAGACTTGGACAACTTCATTGCCAACTTTGGGGATGCAGGGTTTGTCCTTGTGGCCTT 


966 


Db 


958 


1017 


Qy 


967 


GGGC T C CAT GGT GAACAC C T GT C AGAAT C C G GAAAT CT T CAAGGAGAT GAAC AAT G C C T T 
1 M 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 I | | || | || | | | || | M II 1 II II 1 II II 
T G G C T C CAT GT T GAACAC C CAT C AGT C C C AG GAAGT C CT C AAGAAGAT GC AC AAT G C C T T 


1026 


Db 


1018 


1077 


Qy 


1027 


T GCT CAC CT ACC CCAAG GG GT GAT AT G GAAGT GT C AGT GTT CT CAT T GGCC C AAAGAT GT 

HI N 1 M II Mill 1 1 1 1 1 1 1 1 1 1 II | | | | MM 1 II II 1 1 1 II II 

T G C C C AC CT C C C T C AAG G AGT GAT AT G GAC AT G T C AG AGT T C T CAT T G G C C C AG AG AT GT 


1086 


Db 


1078 


1137 


Qy 


1087 


CCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCA 
M 1 1 M 1 1 1 M M 1 1 1 M 1 M 1 1 1 1 II II II II II II 1 1 1 1 1 | || || || || || || 
TCATTTGGCCACAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCA 


1146 


Db 


1138 


1197 


Qy 


1147 


C C C AAG CAT CCGTCTGTTTGT CAC C CAC G G C G G G C AG AAT AG CAT AAT G GAG G C CAT C C A 

HI MMMIMM IMIIMI II 1 MM M IIIIIMM 

CCCCAGCATCCGTCTTTTTGTCACTCATGGTGGGCAGAACAGCGTAATGGAGGCCATCCG 


1206 


Db 


1198 


1257 


Qy 


1207 


GCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATGGTCCG 
1 1 II II II II II 1 M 1 M H Ml II 1 1 M II II 1 II II II 1 II II 1 II II 
T CAT GGT GT GCCCAT GGTGGGATTACCAGT CAAT GGAGACCAGCAT GGAAACAT GGT CC G 


1266 


Db 


1258 


1317 


Qy 


1267 


AGT AGAAGC CAAAAAGT T T GGT GT T T C TAT T C AGTTAAAGAAGC T CAAGGC AG AGAC AT T 

1 1 1 M M M 1 1 M 1 1 M II 1 1 M 1 II 1 1 1 1 M 1 1 II 1 || II 1 1 1 1 

AGT AGT AG C CAAAAATT AT GGT GT C T C TAT C C GGT T GAAT C AGGT C AC AGC C GAC AC AC T 


1326 


Db 


1318 


1377 


Qy 


1327 


GGCT CT TAAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT C C G C G GC AGT G GCT G C 

1 1 1 1 1 1 1 1 1 1 1 II 1 II M 1 1 II M 1 II II 1 1 1 1 II 1 1 II M II 

GAC AC T T AC AAT GAAAC AAGT C ATAGAAGACAAGAGGT ACAAGT CGG C AGT GGT GGC AGC 


1386 


Db 


1378 


1437 


Qy 


1387 


CAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGGATTGA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 Ml II II II II II 1 1 1 II M M 1 II 1 II II 1 II II 1 1 II 
CAGTGTCATCCTGCACTCTCAGCCCCTGAGCCCCGCACAGCGGCTGGTGGGCTGGATCGA 


1446 


Db 


1438 


1497 


Qy 


1447 


CCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCAGCCCTG 

Nil II Ml 1 1 1 1 1 1 1 1 1 M 1 1 II II 1 1 M 1 M 1 II 1 II IMIIMI M 

CCACATCCTCCAGACTGGGGGAGCGACGCACCTCAAGCCCTATGCCTTCCAGCAGCCTTG 


1506 


Db 


1498 


1557 


Qy 


1507 


1 1 1 1 1 1 1 II II 1 M 1 1 M M 1 1 II 1 M II M II II 1 M 1 1 M M III 1 

GCATGAGCAGTACCTCATTGATGTCTTTGTGTTTCTGCTGGGGCTCACTCTGGGCACTAT 


looo 


Db 


1558 


1617 


Qy 


1567 


ATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAGAAAGGT 

INI MMIMMIMI Ml 1 1 1 II 1 II II II 1 II 1 M 1 M II M 1 

GTGGCTTTGTGGGAAGCTGCTGGGTGTGGTGGCCAGGTGGCTGCGTGGGGCCAGGAAGGT 


1626 


Db 


1618 


1677 



Qy 162 7 GAAG G AG AC AT AA G G C C AG G T G C AG CCTTGGCGGGG 1662 

M I I II I I I I I I I I I II I I I I I I I I I I I I 
Db 1678 GAAGAAG AC AT GAG G C TAG GT GT AG CCTTGGGT GAG 1713 
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AX714604 2823 bp DNA linear PAT 15-APR-2003 

Sequence 1288 from Patent EP1293569. 

AX714604 

AX714 604 . 1 GI: 29 889557 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Isogai,T., Sugiyama, T . , Otsuki,T., Wakamatsu, A. , Sato,H., Ishii,S., 
Yamamoto, J. I., Isono,Y., Hio,Y., Otsuka,K., Nagai„K., Irie,R., 
Tamechika,I., Seki,N., Yoshikawa, T . , Otsuka,M., Nagahari,K. and 
Masuho,Y. 
Full-length cDNAs 

Patent: EP 1293569-A 1288 19-MAR-2003; 

Helix Research Institute (JP) ; Research Association for 
Biotechnology ( JP) 

Location/Qualifiers 

1. .2823 

/ organism="Homo sapiens 11 
/mol_type= ff unassigned DNA 1 ' 
/db xref="taxon: 9606" 



ORIGIN 



Query Match 55.2%; Score 1281.6; DB 6; Length 2823; 

Best Local Similarity 85.9%; Pred. No. 0; 

Matches 1422; Conservative 0; Mismatches 234; Indels 0; Gaps 0; 

QY V CCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGAAGTGAG 66 

I II M M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I Mill II I I I I I I I I 
Db 97 CCTTAGCCCGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCTGCTTCTGTGGAAGTGAG 156 

Qy 67 CATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCTGCTCTC 12 6 

I I I I I I I I I I I I I I Mill I I I I II I I II II I M II M I I I II II I II || I I || 
Db 157 CATGGTTGGGCAGCGGGTGCTGCTTCTAGTGGCCTTCCTTCTTTCTGGGGTCCTGCTCTC 216 

Qy 127 AGAGG CT GC CAAAAT C C T GAC AAT AT CT AC AGT AGGT G GAAG C CAT TAT CT AC T GAT GGA 18 6 

M II I II II II II M I II I I I I M I I II I I I I I || | | || || | | II 

Db 217 AGAG GCT G C CAAAAT C C T GAC AAT AT CT ACAC T G GGT G GAAG C CAT T AC CT AC T GT T G GA 27 6 

QY 187 CCGGGTTTCT C AGAT T CT T C AAGAT C AC G GT CAT AAT GT C AC CAT GCT T AAC C AC AAAAG 246 

I I M M I I II II II I I II I I II II II I I I II I I I I I I I || I I 

Db 277 C C G GGT GT CT C AGATT CT T CAAGAGC AT GGT CAT AAT GT GACT AT GC T T CAT C AGAGT G G 336 

Qy 2 47 AGGTCCTT T TAT GC CAGAT T T TAAAAAGGAAGAAAAAT CAT AT CAAGTT AT CAGT T GGCT 30 6 

I Ml II || | M I I I II I MM I II II II II I I I II II II I II I III I 

Db 337 AAAGTTT T T GAT C C CAGATATTAAAGAGGAGGAAAAAT CAT AC CAAGTTAT CAGGT GGT T 39 6 



Qy 



307 T G C AC C T GAAG AT CAT C AAAGAGAAT T T AAAAAGAGT T T T GAT TTCTTTCTG GAAGAAAC 366 



Db 


397 


1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 II 
T T C AC C T GAAG AT CAT C AAAAAAGAAT T AAGAAG CAT T T T GAT AG C T AC AT AGAAAC AG C 


456 


Qy 


367 


T T T AGGT G GC AGAGGAAAAT T T GAAAAC T TAT T AAAT GT T CT AGAAT AC TTGGCGTTG C A 426 

1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II MM 1 MM II 1 1 M 

AT T G GAT GGC AGAAAAGAAT C T GAAGC C CT T GT AAAGC TAAT G GAAAT AT T T G G GACT C A 516 


Db 


457 


Qy 


427 


GT G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT G AGAAC T T C GA 4 86 

M 1 1 1 1 1 1 1 III II 1 II 1 1 1 1 1 1 1 II 1 II 1 II 1 1 II 1 1 || || I I | | || || 
AT GT AGT TAT T T GC T AAGCAGAAAG GAT AT AAT G GAT T C CT T AAAGAAT GAGAACT GT GA 57 6 


Db 


517 


Qy 

Db 


487 
577 


CATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCTTGGGAA 
MM 1 II 1 1 1 1 1 1 II 1 1 1 1 II 1 II 1 1 1 1 II II II 1 I | | | | | || | || III 
TCTGGTATTTGTTGAAGCATTTGATTTCTGTTCTTTCCTGATTGCTGAGAAGCTTGTGAA 


546 
636 


Qy 


547 


GCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCC 
1 M 1 1 1 1 II 1 1 M 1 II 1 1 1 1 II 1 1 II II 1 1 1 1 1 II 1 II II 1 II 1 M 1 1 1 1 1 III 
ACCATTTGTGGCCATTCTTCCCACCACATTCGGCTCTTTGGATTTTGGGCTACCAAGCCC 


606 


Db 


637 


696 


Qy 


607 


CTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCG 
M II II II II 1 1 II 1 II II 1 II 1 II 1 1 II II 1 II 1 1 II II 1 1 1 II 1 1 1 1 1 1 II 1 II I II 
CTTGTCTTATGTTCCAGTATTCCCTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCG 


666 


Db 


697 


756 


Qy 


667 


AGT GAAGAATTTT CT GAT GTT CT TT AGT TT CT GCAGGAGGCAACAGCACAT GCAGT CT AC 

1 1 1 1 M M II II II II 1 II II II II 1 1 1 II II 1 1 1 1 1 1 III 1 1 1 1 1 1 1 II 1 I 1 1 I 

AGTGAAGAATTTTCTGATGTTCTTTAGTTTCTCCAGGAGCCAATGGGACATGCAGTCTAC 


726 


Db 


757 


816 


Qy 


727 


ATTT GACAACAC CAT CAAGGAACATTT CACAGAAGGCTCTAGGCCAGTTT T GTCT CAT CT 

1 M 1 1 M 1 II M II II 1 1 II 1 1 II 1 II 1 II II 1 II II 1 11 II 1 1 II 1 II M 1 1 1 II 1 1 

AT TT GACAACAC CAT CAAG GAGCAT T T C C C AGAAGGCT C TAG G C C AGT T T T GT C T CAT CT 


786 


Db 


817 


876 


Qy 


787 


TCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCTCGACC 
1 M 1 1 1 M II II M 1 II 1 II II 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 M 1 1 1 II II II 
TCTACTGAAAGCAGAGTTGTGGTTTGTTAACTCTGATTTTGCCTTTGATTTTGCCCGGCC 


846 


Db 


877 


936 


Qy 

Db 


847 
937 


TCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACCAGTACC 
M II 1 II II II 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 II II II II 1 II M 1 II II II 1 II II 
CCTGCTTCCCAACACTGTTTATATTGGAGGCTTGATGG7^\AAACCTATTAAACCAGTACC 


906 
996 


Qy 


907 


ACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGACCTT 

M 1 1 1 1 II II II II II 1 1 II 1 1 1 1 1 1 II II 1 1 1 1 1 II 1 II 1 1 1 II 1 1 II II II 

ACAAGACTTGGACAACTTCATTGCCAACTTTGGGGATGCAGGGTTTGTCCTTGTGGCCTT 


966 


Db 


997 


1056 


Qy 


967 


GGGCT C CAT G GT GAACAC CT GT CAGAAT C CGGAAAT C TT CAAGGAGAT GAACAAT G C C T T 
M 1 1 II II 1 II II II 1 1 1 1 1 1 1 II 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 II II 1 II 
T G GCT C CAT GT T GAACAC C CAT CAGT C C C AG GAAGT C CT C AAGAAG AT GC AC AAT G CCT T 


1026 


Db 


1057 


1116 


Qy 


1027 


T G CT C AC C T AC C C CAAG G G GT GAT AT G GAAGT G T C AGT GT T C T CAT T G G C C C AAAGAT GT 

Ml Mill II II 1 II II 1 1 II 1 1 1 1 II 1 II 1 1 II 1 1 II 1 1 II II 1 1 1 II 1 II 

T G C C CAC CT C C CT CAAG GAGT GAT AT GGAC AT GT CAGAGT T CT CAT T G G C C CAGAGAT GT 


1086 


Db 


1117 


1176 


Qy 

Db 


1087 
1177 


CCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCA 
II II 1 1 1 II 1 1 II II 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 II 1 1 II 1 1 II II II 1 1 II 1 1 1 
TCATTTGGCCACAAATGTGAAAATTGTGGACTGGCTT CCT CAGAGT GACCTCCTGGCTCA 


1146 
1236 



Qy 1147 CCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGCCATCCA 1206 

IN I I I I I I I I I I I I I I I I I I I II II I II I I I I I III II I I I I I I I I II I I 



Db 



1237 C C C CAGCAT CCGTCTTTTTGT CACT CAT G GT GG GCAGAAC AGC GT AAT G GAGAC CAT C C G 12 96 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1207 GCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATGGTCCG 12 66 

I I I II I I I I I I I I II I II I I I I I II I I I I I I II I I I I I I I I I I I I 

1297 T CAT GGTGTGCC CAT G GT G GGAT T AC CAGT C AAT G GAGAC C AG CAT GGAAAC AT G GT C C G 1356 

1267 AG T AG AAG C C AAAAA G T TTGGTGTTTC TAT T C AG T T AAAG AAG C T C AAG G C AG AG AC AT T 1326 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1357 AGT AGT AGC C AAAAAT TAT GGT GT C T C TAT C C G GT T GAAT CAG GT C AC AG C C GAC AC AC T 1416 

132 7 G G C T C T T AAG AT G AAAC AAAT CAT G G AA G AC AAG AG AT AC AAGT C C G C G G CAG T G G C T G C 13 86 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I Ml I M I I I I 

1417 GAC ACT T ACAAT GAAACAAGT C ATAGAAGACAAGAGGT ACAAGT C G GCAGT G GT GGC AG C 14 7 6 

138 7 CAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGGATTGA 14 4 6 

I I I I I I I I I I I I I I III II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I | M 
1477 CAGTGTCATCCTGCACTCTCAGCCCCTGAGCCCCGCACAGCGGCTGGTGGGCTGGATCGA 1536 

144 7 CCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCAGCCCTG 1506 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I II 
1537 CCACATCCTCCAGACTGGGGGAGCGACGCACCTCAAGCCCTATGTCTTCCAGCAGCCTTG 1596 

1507 GCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGGGACTCT 1566 

I M I II I Ml I I I II I II II I I I I I I I I I II I I I II I I I I I I I I I I I I I III I 
1597 GCATGAGCAGTACCTCATTGATGTCTTTGTGTTTCTGCTGGGGCTCACTCTGGGCACTAT 1656 

1567 ATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAGAAAGGT 1626 

I I I I I II I I I I I I I I I I I I I I I I Ml | | I I I I I I I I I I I I I I I I I I I I I I I I 
1657 GTGGCTTTGTGGGAAGCTGCTGGGTGTGGTGGCCAGGTGGCTGCGTGGGGCCAGGAAGGT 1716 

1627 GAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGG 1662 

I I I I I II II I I I I I I I I I I I I I I I I I I I I 
1717 GAAGAAGACAT GAGGCTAGGT GTAGCCTTGGGTGAG 1752 
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AK057066 

LOCUS 

DEFINITION 
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VERSION 
KEYWORDS 
SOURCE 
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REFERENCE 
AUTHORS 



TITLE 



AK057066 2823 bp mRNA linear PRI 01-AUG-2002 

Homo sapiens cDNA FLJ32504 fis, clone SMINT1000016, weakly similar 
to 2-HYDROXYACYLSPHINGOSINE 1-BETA-GALACTOSYLTRANSFERASE PRECURSOR 
(EC 2.4.1.45) . 
AK057066 

AK057066. 1 GI: 16552 64 3 

oligo capping; fis (full insert sequence) . 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Kawakami,B., Sugiyama,A., Takemoto,M., Sugiyama,T., Irie,R., 
Otsuki,T., Sato,H., Wakamatsu,A. , Ishii,S., Yamamoto, J. , Isono,Y., 
Kawai-Hio, Y. , Saito,K., Nishikawa, T . , Kimura,K., Yamashi ta, H . , 
Matsuo,K., Nakamura,Y., Sekine,M., Kikuchi,H., Kanda,K., 
Wagatsuma,M. , Murakawa, K. , Kanehori, K. , Takahashi-Fu j ii , A. , 
Oshima,A., Suzuki, Y., Sugano,S., Nagahari,K., Masuho,Y., Nagai,K. 
and Isogai,T. 

NEDO human cDNA sequencing project 



JOURNAL 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



COMMENT 



FEATURES 

source 



CDS 



Unpublished 

2 (bases 1 to 2823) 

Isogai,T., Otsuki,T. and Sugiyama,T. 
Direct Submission 

Submitted (24-OCT-2001 ) Takao Isogai, Helix Research Institute, 
Genomics Laboratory; 1532-3 Yana, Kisarazu, Chiba 292-0812, Japan 
(E-mail : genomics @hri .co.jp, Tel: 81-438-52-3 97 5, Fax: 81-4 3 8-52-3986) 
NEDO human cDNA sequencing project supported by Ministry of 
Economy, Trade and Industry of Japan; cDNA full insert sequencing: 
Research Association for Biotechnology (RAB) ; cDNA library 
construction: Helix Research Institute (HRI) (supported by Japan 
Key Technology Center etc.); 5 1 - & 3' -end one pass sequencing: RAB, 
HRI, and Biotechnology Center, National Institute of Technology and 
Evaluation; clone selection for full insert sequencing: RAB and 
HRI . 

Location/Qualifiers 
1. .2823 

/organism="Homo sapiens" 
/mol_type= l, mRNA" 
/db_xref="taxon: 9606" 
/clone="SMINT1000016" 
/tissue_type=" small intestine" 
/clone_lib="SMINTl" 
/note="cloning vector: pMEl8SFL3" 
158. .1729 

/note="unnamed protein product" 
/codon_start=l 
/protein_id="BAB71358 .1" 
/db_xref="GI: 16552644" 

/ translation="MVGQRVLLLVAFLLSGVLLSEAAKILTISTLGGSHYLLLDRVSQ 
ILQEHGHNVTMLHQSGKFLIPDIKEEEKSYQVIRWFSPEDHQKRIKKHFDSYIETALD 
GRKESEALVKLMEIFGTQCSYLLSRKDIMDSLKNENCDLVFVEAFDFCSFLIAEKLVK 
P FVAI L PTT FGS LD FGLP S P L S YVPVFP S L LTDHMD FWGRVKN FLMFFS FS RS QWDMQ 
STFDNTIKEHFPEGSRPVLSHLLLKAELWFVNSDFAFDFARPLLPNTVYIGGLMEKPI 
KPVPQDLDNFIANFGDAGFVLVAFGSMLNTHQSQEVLKKMHNAFAHLPQGVIWTCQSS 
HWPRDVIIIATNVKIVDWLPQSDLLAHPSIRLFVTHGGQNSViyiETIRHGVPMVGLPWG 
DQHGNMVRWAKNYGVSIRLNQVTADTLTLTMKQVIEDKRYKSAWAASVILHSQPLS 
PAQRLVGWIDHILQTGGATHLKPYVFQQPWHEQYLIDVFVFLLGLTLGTMWLCGKLLG 
WARWLRGARKVKKT " 



ORIGIN 



Query Match 55.2%; 
Best Local Similarity 85.9%; 
Matches 1422; Conservative 



Score 1281.6; 
Pred. No. 0; 
0; Mismatches 



DB 9; Length 2 823; 



234; Indels 



0; Gaps 



0; 



Qy 

Db 



97 



CCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGAAGTGAG 66 
I I I M I M I I I I I I II I I II I I I I I I I I I I I I I I I I | | I | | Mill II I I I I I I I I 
CCTTAGCCCGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCTGCTTCTGTGGAAGTGAG 156 



Qy 

Db 

Qy 

Db 



67 CATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCTGCTCTC 12 6 
I I M I I I I I I I I I I Mill M I I I II II I I I I I II II I II I II I II I II I I I M 
157 CATGGTTGGGCAGCGGGTGCTGCTTCTAGTGGCCTTCCTTCTTTCTGGGGTCCTGCTCTC 216 



127 



186 



AGAGG C T GC CAAAAT C CT GACAAT AT CT AC AGT AG GT G GAAG C CAT TAT CT AC T GAT G GA 

I I I I I I I M M I I I II II M II I I II II II I I M M I I I I I II II I MUM I I I I 

217 AGAGGCTGCCAAAATCCTGACAATATCTACACTGGGTGGAAGCCATTACCTACTGTTGGA 27 6 



QY 187 CCGGGTTTCT C AGAT T CT T CAAGAT C ACG GT C AT AAT GT C AC CAT GCT T AAC C AC AAAAG 24 6 

I I I I I I I I I I I I I I I II I I II II II I I I I I I I I I I I II I II I II I II I I 
Db 277 C C GGGT GT CT C AGATT CT T CAAGAGCAT G GT CAT AAT GT GACT AT G CT T CAT CAGAGT G G 33 6 

Qy 24 7 AGGT C CTTT T AT GCCAGATTT TAAAAAGGAAGAAAAAT CAT AT C AAGT TAT CAGT T GGCT 3 06 

I Ml M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I 

Db 337 AAAGTT T T T GAT C C C AGAT AT T AAAGAGGAG GAAAAAT CAT AC CAAGT TAT C AG GT G GT T 396 

Qy 307 T G C AC C T G AAG AT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G AAG AAAC 3 66 

I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I II II | I | I I I 
Db 397 TT CACCTGAAGATCATCAAAAAAGAATTAAGAAGCATTTT GATAGCTACATAGAAACAGC 456 

Qy 367 T T T AGGT G GC AGAGGAAAAT T T GAAAACT TAT T AAAT GT T C T AGAAT ACT T G G C GT T G C A 42 6 

I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I II 
Db 457 AT T G GAT G GC AGAAAAGAAT C T GAAG C C CTT GTAAAGCT AAT G GAAAT AT T T GGGACT C A 516 

Qy 427 GT G CAGT CAT T T T T T AAAT AG AAAG GAT AT CAT GGAT T C C T T AAAGAAT GAGAAC T T C GA 486 

M Ml I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 517 AT GT AGT T AT TT G C TAAGC AGAAAG GAT AT AAT G GAT T C CT T AAAGAAT G AGAACT GT GA 57 6 

Qy 487 CAT G GT GAT AGT T GAAACT T T T GACT ACT GT CCTT T C C T GAT T GC T GAGAAGCT T G G GAA 54 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 577 TCTGGTATTTGTTGAAGCATTTGATTTCTGTTCTTTCCTGATTGCTGAGAAGCTTGTGAA 636 

Qy 547 GCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCC 606 

I I I I i i M i i i i i I I I i I Mil I I I i I I I I I I I I I i I I I I I i I i I i I i I i I III 

Db 637 ACCATTTGTGGCCATTCTTCCCACCACATTCGGCTCTTTGGATTTTGGGCTACCAAGCCC 696 

Qy 607 CTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCG 666 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 697 CTTGTCTTATGTTCCAGTATTCCCTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCG 756 

Qy 667 AGT GAAGAAT TT T CT GAT GT T CT T T AGT T T C T GCAGGAGGCAAC AGC AC AT G C AGT CT AC 72 6 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I III I I I I I I I I I II I II 
Db 757 AGT GAAGAAT T T T CT GAT GT T C T T T AGT T T CT C C AGGAG C CAAT G G GAC AT GC AGT CT AC 816 

Qy 72 7 AT T T GACAAC AC CAT CAAG GAAC AT T T C AC AGAAG GCT CT AGGCC AGT T T T GT CT CAT CT 7 86 

I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 817 AT T T GAC AAC AC CAT CAAG GAG CAT T T C C CAGAAGG C T C T AGG C C AGT T T T GT CT CAT CT 8 76 

Qy 787 TCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCTCGACC 846 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I II II 
Db 877 TCTACTGAAAGCAGAGTTGTGGTTTGTTAACTCTGATTTTGCCTTTGATTTTGCCCGGCC 936 

Qy 847 TCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACCAGTACC 9 06 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I 
Db 937 CCTGCTTCC C AAC ACT GT T TAT AT T G GAG G C T T GAT G GAAAAAC C TAT T AAAC CAGT AC C 996 

Qy 907 ACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGACCTT 9 66 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I 
Db 997 ACAAGACTTGGACAACTTCATTGCCAACTTTGGGGATGCAGGGTTTGTCCTTGTGGCCTT 1056 

Qy 967 G G G CT C CAT GGT GAAC AC CT GT C AGAAT C C G GAAAT CTT C AAGGAGAT GAACAAT G C C T T 1026 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1057 T G GC T C C AT GT T GAAC AC C CAT CAGT C C C AG GAAGT C CT CAAGAAGAT G C ACAAT GC C T T 1116 

Qy 1027 TGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAAAGATGT 108 6 



Db 1117 T G C C CAC CT C C CT CAAG GAGT GAT AT GG ACAT GT CAGAGT T CT CAT T G GC C C AGAGAT GT 117 6 

Qy 1087 CCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCA 114 6 

M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 117 7 TCATTTGGCCACAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCA 12 36 

Qy H47 C C CAAGCAT C C GT CT GT T T GT CAC C CAC GGC GGGCAGAAT AGC ATAAT GGAGGC C AT C CA 1206 

Ml I I I I I I I I II I I I I I I I I I II II I I I I I I I I III I I I I I I I I I M I I I 
Db 1237 C C C CAGCAT CC GT CTTT TT GT CACT CAT GGT GGGCAGAAC AGC GTAAT GGAGAC CAT C C G 12 96 

Qy 12 07 GCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATGGTCCG 12 66 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I II II I II I I I I II I 
Db 1297 T CAT GGT GT GC C CAT GGT GGGAT T ACC AGTCAAT GGAGAC CAGCAT GGAAACAT GGT C C G 135 6 

Qy 1267 AGT AGAAG C CAAAAAGT TT GGT GT T T C TAT T C AGT T AAAGAAG C T CAAGG CAGAGAC AT T 1326 

I I I I I I I I I I II I I I I I II I I I I I I I I I I | | | | | | | | I I I | | | | | 
Db 1357 AGT AGT AGC CAAAAAT TAT GGT GT C T CT AT C C GGTT GAAT CAGGT CACAGC C GAC AC AC T 1416 

Qy 1327 G G C T CT T AAGAT GAAAC AAAT CAT G GAAGAC AAGAGAT AC AAGT C C G C G G C AGT G GC T GC 138 6 

I I I I I I I I I I I I I I I | | | | | | | | || | | | || M | || | | | | | | Mill || 
Db 1417 GACAC T T AC AAT GAAAC AAGT CATAGAAGACAAGAGGTACAAGT CGGCAGTGGTGGCAGC 14 76 

Qy 1387 CAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGGATTGA 1446 

I I I I I I I I I I M I I III II II II I I I I I I I I I I I I I I I I I I I I I I I I | | | | || 
Db 1477 CAGTGTCATCCTGCACTCTCAGCCCCTGAGCCCCGCACAGCGGCTGGTGGGCTGGATCGA 1536 

Qy 1447 CCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCAGCCCTG 1506 

I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I II 
Db 1537 CCACATCCTCCAGACTGGGGGAGCGACGCACCTCAAGCCCTATGTCTTCCAGCAGCCTTG 1596 

Qy 1507 GCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGGGACTCT 1566 

I I I I I M I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I II I III I 
Db 1597 GCATGAGCAGTACCTCATTGATGTCTTTGTGTTTCTGCTGGGGCTCACTCTGGGCACTAT 1656 

Qy 1567 ATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAGAAAGGT 1626 

I I M I I I I I I I I I I I I I I I I II I III I I II I I I I I I I | | | | | | | || | 

Db 1657 GTGGCTTTGTGGGAAGCTGCTGGGTGTGGTGGCCAGGTGGCTGCGTGGGGCCAGGAAGGT 1716 

Qy 1627 GAAGGAGACATAAGGCCAGGT GCAGCCTT GGC GGGG 1662 

I I II II I I I I I I I I I I I I I I I II I I I I I I 
Db 1717 GAAGAAGACAT GAGGCT AG GT GT AGC CT T GGGT GAG 1752 
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AX327327 
Sequence 
AX327327 
AX327327. 



12 



2086 bp 
from Patent WO0179468. 

GI:18097873 



DNA 



linear PAT 07-JAN-2002 



(human) 



Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 

Policky, J.L. , Hafalia, A. , Burford,N 



Crania ta; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



Ring,H.Z., Lai, P. 



Tribouley,C.M. , Yao, M. G . , Yue, H . , Tang,Y.T., Patterson, C . , Das,D., 
Sanjanwala,M. S. , Gandhi , A. R. , Reddy,R., Khan, F. A., Baughn,M.R., 
Ramkumar , J. , Griffin, J. A. and Au-Young,J. 
TITLE Drug metabolizing enzymes 

JOURNAL Patent: WO 0179468-A 12 25-OCT-2001; 
Incyte Genomics, Inc. (US) 
FEATURES Location/Qualifiers 
source 1 . .2086 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 
/note="Incyte ID No: 2516747CB1" 

ORIGIN 

Query Match 55.2%; Score 1280; DB 6; Length 2086; 

Best Local Similarity 85.8%; Pred. No. 0; 

Matches 1421; Conservative 0; Mismatches 235; Indels 0; Gaps 0 

Qy 7 CCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGAAGTGAG 66 

I I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I I I I I I I I INN II I I I I I I I I 
Db 59 CCTTAGCCCGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCTGCTTCTGTGGAAGTGAG 118 

Qy 67 CATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCTGCTCTC 12 6 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 
Db 119 CATGGTTGGGCAGCGGGTGCTGCTTCTAGTGGCCTTCCTTCTTTCTGGGGTCCTGCTCTC 17 8 

Qy 12 7 AGAGGCT GC CAAAAT C C T GACAAT AT CT AC AGT AG GT G GAAGC CAT TAT C TACT GAT G GA 18 6 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II II II I I I I I I 
Db 17 9 AGAGG C T G C CAAAAT C C T GACAAT AT C T AC ACT G GGT G GAAG C CAT T AC C T AC T GT T GGA 238 

Qy 187 CCGGGTTTCT C AGAT T CT T CAAGAT C AC GGT C AT AAT GT C AC CAT G CT T AAC C AC AAAAG 246 

I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I II II I I I I I I I II I I 
Db 239 C C G G GT GT CT C AGAT T CTT CAAGAGC AT G GT CAT AAT GT GACT AT G CT T CAT C AGAGT G G 2 98 

Qy 247 AG GT C C T T T TAT G C C AG AT T T T AAAAAG G AAG AAAAAT CAT AT C AAG T TAT C AGT T G G C T 306 

I Ml M I M I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I II III I 

Db 2 99 AAAGT T T TT GAT C C C AGAT AT TAAAG AGGAGGAAAAAT CAT AC CAAGT TAT C AGGT GGT T 358 

Qy 307 T G C AC C T GAAG AT CAT C AAAG AG AAT T T AAAAAG AG T T T T GAT TTCTTTCTG G AAG AAAC 366 

I I M I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I II I I I I II 
Db 359 T T C AC C T GAAG AT CAT C AAAAAAGAAT T AAG AAG CAT T T T GAT AG C T AC AT AGAAAC AG C 418 

Qy 367 TTTAGGTGG C AG AG G AAAAT T T G AAAAC T T AT T AAAT G T T C TAG AAT AC TTGGCGTTGCA 42 6 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II 
Db 419 AT T G GAT GG C AGAAAAGAAT C T GAAG C C CT T GT AAAGCT AAT GGAAAT AT T T GG GAC T C A 47 8 

Qy 427 GT G C AGT CAT T T T T T AAAT AGAAA.G GAT AT CAT G GAT T C C T TAAAG AAT G AG AACT T C G A 48 6 

I I I I I I I I I III I I | | | | | | | | | | | | | || | | | | M I I I I I I I I I I I I I I I 
Db 4 79 AT GT AGT TAT T T GCTAAGC AGAAAG GAT AT AAT G GAT T C CT T AAAGAAT GAGAACT AT GA 538 

Qy 4 87 CAT GGTGAT AGTT GAAACT TTT GACTACTGT C CT TT CCTGATT GCT GAGAAGCTT GGGAA 54 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I Ml 

Db 53 9 TCTGGTATTTGTTGAAGCATTTGATTTCTGTTCTTTCCTGATTGCTGAGAAGCTTGTGAA 598 

Qy 547 GCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCC 606 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I III 
Db 599 ACCATTTGTGGCCATTCTTCCCACCACATTCGGCTCTTTGGATTTTGGGCTACCAAGCCC 658 



Qy 607 CTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCG 666 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I 
Db 659 CTTGTCTTATGTTCCAGTATTCCCTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCG 718 

Qy 667 AGT G AAG AAT T T T C T GAT G T T C T T TAG T T T C T G C AG GAG G C AAC AG C A C AT G C AG T C T AC 72 6 

I M I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I III I I I II I I I I I | I M 
Db 719 AGT GAAGAAT T T T C T GAT GT T CT TT AGT T T C T C C AG GAGG C AAT GG GAC AT G C AGT C T AC 778 

Qy 727 AT T T GAC AAC AC CAT C AAG GAAC AT T T C AC AG AAG G C T C TAG G C C AG TTTTGTCT CAT C T 78 6 

I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 77 9 AT T T GACAAC AC CAT CAAG GAGC AT TT C C C AGAAGG CT CT AG G C C AGT TT T GT CT C AT C T 8 38 

Qy 787 TCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCTCGACC 84 6 

I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I II I II I I 
Db 839 TCTACTGAAAGCAGAGTTGTGGTTTGTTAACTCTGATTTTGCCTTTGATTTTGCCCGGCC 8 98 

Qy 847 TCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACCAGTACC 906 

I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 899 CCTGCTTCCCAACACTGTTTATATTGGAGGCTTGATGGAAAAACCTATTAAACCAGTACC 95 8 

Qy 907 ACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGACCTT 966 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 959 ACAAGACTTGGACAACTTCATTGCCAACTTTGGGGATGCAGGGTTTGTCCTTGTGGCCTT 1018 

Qy 967 G G G C T C CAT G G T GAAC AC C T G T C AG AAT C C G GAAAT C T T CAAG GAG AT GAAC AAT G C C T T 1026 

I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I 

Db 1019 T GGCT C CAT GTT GAACAC C CAT C AGT C C C AGGAAGT C C T CAAGAAGAT G C ACAAT GC C TT 1078 

Qy 102 7 T G CT CAC C T AC C C CAAG GGGT GAT AT G GAAGT GT CAGT GTT CT CAT T G GC C CAAAGAT GT 108 6 

III I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1079 T GCC CAC CT C C C T CAAGGAGT GAT AT GGAC AT GT CAGAGT T CT CAT T GG C C C AGAGAT GT 1138 

Qy 108 7 CCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCA 1146 

II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1139 TCATTTGGCCACAAATGTGAAAATTGTGGACTGGCTTCCTCGGAGTGACCTCCTGGCTCA 1198 

Qy 1147 C C CAAG CAT CCGTCTGTTTGT CAC C CAC G G C G G G C AG AAT AG CAT AAT G GAG G C CAT C C A 12 06 

Ml I I I I I II I I I I I I I I I I I I II II I I I I I I I I III I I I I I I I I I I I I I I I 
Db 119 9 CCCCAGCATCCGTCTTTTTGTCACTCATGGTGGGCAGAACAGCGTAATGGAGGCCATCCG 125 8 

Qy 1207 GC AT GGT GT GC C CAT GGT G G GGAT C C CT CT CT T T GGAGAC C AG C C T GAAAAC AT GGT C CG 12 66 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I II I I I I I I II I I I I 
Db 1259 T CAT GGT GT GCC CAT GGT G G GAT T AC CAGT CAAT G GAGAC CAGCAT G GAAAC AT GGT C C G 1318 

Qy 12 67 AGT AGAAGC C AAAAAGT T T GGT GTT T CT ATT CAGT T AAAGAAG C T CAAG GC AGAGAC AT T 132 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1319 AGTAGTAGCCAAAAATTATGGTGTCTCTATCCGGTTGAATCAGGTCACAGCCGACACACT 1378 

Qy 1327 GGCT CTTAAGAT GAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT GGCT GC 1386 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 
Db 1379 GAC AC T T AC AAT GAAAC AAGT C AT AGAAGAC AAGAG GT AC AAGT C G G CAGT G GT G G C AG C 1438 

Qy 1387 CAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGGATTGA 1446 

I I I I I I I I I I I I I I III II II II I I I I I I I I I I I I I I I I I I I II I I I I I I I II 
Db 1439 CAGTGTCATCCTGCACTCTCAGCCCCTGAGCCCCGCACAGCGGCTGGTGGGCTGGATCGA 14 98 



Qy 1447 C C AC GT C C T C C AGAC AGGG G GC GC GAC GC AC C T CAAGC C C TAT GT C TT T C AG C AGC C C T G 1506 

I M I I I I I I I I M I I I I I I I I I I I I II I I I I I M | | I I | | | Ml I I I I I I | | II 
Db 14 99 CCACATCCTCCAGACTGGGGGAGCGACGCACCTCAAGCCCTATGCCTTCCAGCAGCCTTG 1558 

Qy 15 07 GCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGGGACTCT 15 66 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Db 1559 GCATGAGCAGTACCTCATTGATGTCTTTGTGTTTCTGCTGGGGCTCACTCTGGGCACTAT 1618 

Qy 1567 ATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAGAAAGGT 1626 

I I I I M I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I II I I I I | | | | | 
Db 1619 GTGGCTTTGTGGGAAGCTGCTGGGTGTGGTGGCCAGGTGGCTGCGTGGGGCCAGGAAGGT 1678 

Qy 1627 GAAG GAGAC AT AAGG C C AG GT G C AG CCTTGGCGGGG 1662 

I I I I I I I I I I I I I I I I I I I I M 

Db 167 9 GAAGAAGAC AT GAG GC TAG GT GT AG CCTTGGGT GAG 1714 
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AX359923 1572 bp DNA linear PAT 13-FEB-2002 

Sequence 3 from Patent WO0202774. 

AX359923 

AX359923. 1 GI : 18675565 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Leiby,K.R., Cook, W.J. and Spaltmann,F. 

32626, a human udp-glycosyltransf erase and uses thereof 
Patent: WO 0202774-A 3 10-JAN-2002; 
Millennium Pharmaceuticals, Inc. (US) 

Location/Qualifiers 

1. .1572 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon: 9606" 



ORIGIN 



Query Match 52.2%; Score 1212; DB 6; Length 1572; 

Best Local Similarity 85.7%; Pred. No. 1.5e-310; 

Matches 1347; Conservative 0; Mismatches 225; Indels 0; Gaps 0; 

Qy 68 ATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCTGCTCTCA 12 7 

MM II I I I I I II II II I I I I I I I Ml I I II II I II I I I I I I I I 

Db 1 ATGGTTGGGCAGCGGGTGCTGCTTCTAGTGGCCTTCCTTCTTTCTGGGGTCCTGCTCTCA 60 

QY 12 8 GAG G CT G C C AAAAT C CT GAC AAT AT C T AC AGT AG GT G GAAG C CAT TAT CT ACT GAT G GAC 187 
MUM M I I II I II I II I I I I I I I I I I I I I I I I I I I I I I MINI I I I I I 

Db 61 GAG G CT GC CAAAAT C C T GACAAT AT C T AC ACT GG GT GGAAGC CAT T AC C T AC T GT T G GAC 12 0 



QY 18 8 C GGGT TT CT CAGATT CTT CAAGAT CAC GGT CAT AAT GT CAC CAT GCTT AAC CACAAAAGA 247 

M II I I I I I I I I I I I II I I I I I II I I I I I M I I I I II I I I I I I I || I II 

Db 121 CGGGTGTCT C AG AT T C T T C AAG AG CAT GGT CAT AAT GT GAC TAT GCTT CAT C AG AG T GG A 180 

Qy 248 G GT C C T T T TAT G C C AG AT T T T AAAAAGG AAG AAAAAT CAT AT C AAG T TAT C AGT T G G C T T 307 



Db 181 AAGTTTTTGATCCCAGATATTAAAGAGGAGGA?lAAATCATACCAAGTTATCAGGTGGTTT 24 0 

Qy 308 G C AC CT GAAGAT CAT CAAAGAGAAT T T AAAAAGAGT T T T GAT T T CT T T C T GGAAGAAAC T 367 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I || | | | | || 
Db 241 T C AC C T GAAGAT CAT C AAAAAAGAAT T AAGAAG CAT T T T GAT AG C T AC AT AGAAAC AG C A 300 

Qy 368 T TAG GT G G C AG AG GAAAAT T T G AAAAC T TAT T AAAT GT T C T AGAAT ACT TGGCGTTG C AG 427 

I I I I I I M I I I I I I I II I II I I I I I I I I I M I I II 
Db 301 T T G GAT G G C AGAAAAGAAT C T GAAG C C C T T GT AAAG C T AAT G GAAAT AT T T G G G AC T C AA 360 

Qy 428 T G C AGT CAT T T T T T AAAT AG AAAG GAT AT CAT G GAT T C C T T AAAG AAT G AG AAC T T C G AC 4 87 

M Ml I I I I Ml I I I I I I I I I II I I I I I I I I I I ! I I I I I I II I I I I I I II 
Db 3 61 T GTAGTT ATTT GCTAAGCAGAAAGGATATAAT GGATT C CTTAAAGAAT GAGAACT AT GAT 42 0 

Qy 48 8 ATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCTTGGGAAG 54 7 

I I I I I I M I II I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I | M 
Db 4 21 CTGGTATTTGTTGAAGCATTTGATTTCTGTTCTTTCCTGATTGCTGAGAAGCTTGTGAAA 48 0 

Qy 54 8 CCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCCC 607 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 481 CCATTTGTGGCCATTCTTCCCACCACATTCGGCTCTTTGGATTTTGGGCTACCAAGCCCC 54 0 

Qy 608 TTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCGA 667 

I I I I I I I I I I I I I I 1 I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TTGTCTTATGTTCCAGTATTCCCTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCGA 600 

Qy 668 GT GAAGAAT TT T CT GAT GT T CTT T AGT T T C T GCAGG AG G CAAC AGC ACAT G C AGT C T AC A 727 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I III I I I I I I I I I I I I I I I 
Db 601 GT GAAGAAT T T T C T GAT GT T C TT T AGTT T CT C C AG GAGC CAAT G GGAC AT G CAGT CT ACA 660 

Qy 728 T T T GACAAC AC CAT CAAG GAACAT T T C ACAGAAGGC T C T AGGC CAGT TT T GT CT CAT CTT 787 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 T T T GACAAC AC CAT C AAGGAG CAT T T C C CAGAAGG CT CT AGG C CAGT T T T GT CT C AT CTT 72 0 

Qy 7 88 CT ACT GAAAGCAGAGT T GT GGT T CAT T AACT CT GACT T T GC CTT T GAT TTT GCT CGAC CT 847 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I II II 
Db 721 CTACTGAAAGCAGAGTTGTGGTTTGTTAACTCTGATTTTGCCTTTGATTTTGCCCGGCCC 78 0 

Qy 8 48 CTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACCAGTACCA 907 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 781 CTGCTTCC CAAC ACT GT T TAT AT T GGAG GC T T GAT G GAAAAAC C TAT TAAAC CAGT AC CA 84 0 

Qy 908 CAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGACCTTG 967 

I I I I I I I I I I I I I I I I I I I II I I I I III II I I I I I I I I I I I I II II 

Db 841 CAAGACTTGGACAACTTCATTGCCAACTTTGGGGATGCAGGGTTTGTCCTTGTGGCCTTT 900 

Qy 968 GGCT CCAT GGT GAACACCT GT CAGAAT C C GGAAAT CTT CAAGGAGAT GAACAAT GCCT TT 1027 

I I M I I I I I I I I I I I I I I I I I I M I Ill Mill I I I I I I I I II I 

Db 901 GG CT C CAT GT T GAAC AC C CAT CAGT C C C AG GAAGT C C T CAAGAAGAT G C ACAAT GC C T T T 960 

Qy 1028 GCT CAC CT AC C C CAAG GG GT G AT AT G GAAGT GT CAGT GTT CT CAT T GGC C C AAAGAT GT C 10 87 

M MMI II I II I I I II I I II I I I MUM II I II I I I II I II I I I I I I I I 
Db 961 G C C CAC C T C C C T CAAG G AGT GAT AT G G AC AT G T C AG AG T T C T CAT T G G C C C AG AG AT GTT 1020 

Qy 108 8 CACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCAC 114 7 

M MM I I I I I I I I I II I I || I I I | || || | || | || | M II I I I I I I I II II II I I I 



Db 



1021 CATTTGGCCACAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCAC 108 0 



Qy 114 8 C C AAG CAT CCGTCTGTTTGT C AC C C AC G G C G G G C AG AAT AG C AT AAT G GAG G C CAT C C AG 1207 

M I I I I I I I I I I I I I I I I I I I II II I I I I I I I I III I I I I I I I I I I I I I I I 
Db 1081 CCCAGCATCCGTCTTTTTGTCACTCATGGTGGGCAGAACAGCGTAATGGAGGCCATCCGT 114 0 

Qy 12 08 CATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATGGTCCGA 12 67 

I I I I I I I I I I II II I I I I I I I II II I I I I I I I I I I I II II I I I I I I I I I I I 
Db 1141 C AT GGT GT GC C CAT GGT G G GAT T AC C AGT C AAT G GAGAC C AG CAT GGAAAC AT GGT C C GA 1200 

Qy 1268 GT AGAAG C CAAAAAGT T T GGT GT T T CT AT T C AGT TAAAGAAGCT CAAG GC AGAGAC AT T G 1327 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I II II I I I II 
Db 1201 GT AGT AGC C AAAAAT TAT GGTGTCTC TAT C C G GT T GAAT C AG GT C AC AG C C GAC AC AC T G 1260 

Qy 1328 G C T C T T AAGAT G AAAC AAAT CAT G G AAG AC AAG AG AT AC AAGT C C G C G G C AG TGGCTGCC 1387 

I I I I I I II I I I I I I I I I I I I I II I I I I I I I II I II I I II I I I I I I III 
Db 12 61 ACACTTACAAT GAAACAAGTCATAGAAGACAAGAGGTACAAGT CGGCAGTGGTGGCAGCC 132 0 

Qy 13 8 8 AGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGGATTGAC 14 4 7 

I I I I I I I I I II I I III II II II MINI I I I I I I I I I I I I II I I I I I I I I III 
Db 1321 AGTGTCATCCTGCACTCTCAGCCCCTGAGCCCCGCACAGCGGCTGGTGGGCTGGATCGAC 138 0 

Qy 1448 CACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCAGCCCTGG 1507 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I III II I I I I I I III 
Db 1381 CACATCCTCCAGACTGGGGGAGCGACGCACCTCAAGCCCTATGCCTTCCAGCAGCCTTGG 144 0 

Qy 1508 CATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGGGACTCTA 1567 

I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I II I I I I I I I III I 
Db 1441 CATGAGCAGTACCTCATTGATGTCTTTGTGTTTCTGCTGGGGCTCACTCTGGGCACTATG 1500 

Qy 1568 TGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAGAAAGGTG 1627 

I I I I I I I I I I I I I I I I I I I II I I III I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1501 TGGCTTTGTGGGAAGCTGCTGGGTGTGGTGGCCAGGTGGCTGCGTGGGGCCAGGAAGGTG 1560 

Qy 1628 AAGGAGACATAA 1639 

III I I II I I I 
Db 1561 AAGAAGAC AT G A 1572 
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AC008947 88948 bp DNA linear HTG 05-MAY-2000 

Homo sapiens chromosome 5 clone CTD-2330L9, WORKING DRAFT SEQUENCE, 
19 unordered pieces. 
AC008947 

AC008 947 .5 GI : 7710868 

HTG; HTGS_PHASE1; HTGS_DRAFT. 

Homo sapiens ( human ) 

Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 88948) 

DOE Joint Genome Institute. 
Sequencing of Human Chromosome 5 
Unpublished 

2 (bases 1 to 88948) 

DOE Joint Genome Institute. 



Direct Submission 

Submitted ( 03-AUG-1999 ) Production Sequencing Facility, DOE Joint 
Genome Institute, 2800 Mitchell Drive, Walnut Creek, CA 94598, USA 
On May 5, 2000 this sequence version replaced gi: 6997051. 

Genome Center 

Center: Joint Genome Institute 
Center Code: JGI 

Web site: http://www.jgi.doe.gov 

Project Information 

Center Project Name: 754542 

Center clone name: CITB-H1 2330L9 



Summary Statistics 

Consensus quality: 67454 bases at least Q40 

Consensus quality: 80777 bases at least Q30 

Consensus quality: 83103 bases at least Q20 

Estimated insert size: 85000; pulse field gel estimation 

Estimated insert size: 87148; sum-of-contigs estimation 

Quality coverage: 3.94 in Q20 bases; pulse field gel estimation 

Quality coverage: 3.84 in Q20 bases; sum-of-contigs estimation. 

* NOTE: This is a f working draft 1 sequence. It currently 

* consists of 19 contigs. The true order of the pieces 

* is not known and their order in this sequence record is 

* arbitrary. Gaps between the contigs are represented as 

* runs of N, but the exact sizes of the gaps are unknown. 

* This record will be updated with the finished sequence 

* as soon as it is available and the accession number will 



* 


be preserved. 










1 


2375 


: contig 


of 2375 


bp in length 




2376 


2475 


: gap of 


unknown 


length 


* 


2476 


5577 


: contig 


of 3102 


bp in length 


* 


5578 


5677 


: gap of 


unknown 


length 




5678 


7838 


: contig 


of 2161 


bp in length 


* 


7839 


7938 


: gap of 


unknown 


length 


* 


7939 


10123 


: contig 


of 2185 


bp in length 


* 


10124 


10223 


: gap of 


unknown 


length 


* 


10224 


12755 


: contig 


of 2532 


bp in length 


* 


12756 


12855 


: gap of 


unknown 


length 


* 


12856 


15242 


: contig 


of 2387 


bp in length 


* 


15243 


15342 


gap of 


unknown 


length 




15343 


17589 


contig 


of 2247 


bp in length 


* 


17590 


17689 


gap of 


unknown 


length 




17690 


20485 


contig 


of 2796 


bp in length 




20486 


20585 


gap of 


unknown 


length 




20586 


23628 


contig 


of 3043 


bp in length 


* 


23629 


23728 


gap of 


unknown 


length 


* 


23729 


26745: 


contig 


of 3017 


bp in length 




26746 


26845: 


gap of 


unknown 


length 




26846 


30194: 


contig 


of 3349 


bp in length 




30195 


30294: 


gap of 


unknown 


length 




30295 


34563: 


contig 


of 4269 


bp in length 


* 


34564 


34663: 


gap of 


unknown 


length 


* 


34664 


39707: 


contig 


of 5044 


bp in length 




39708 


39807: 


gap of 


unknown 


length 




39808 


47134: 


contig 


of 7327 


bp in length 




47135 


47234: 


gap of 


unknown 


length 
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A 1 O "3 R 

4 /z jD 


oz l b / : 


contig 


or 5533 bp in length 




Oz / DO 


Oz o o / : 


gap of 


unknown length 




JiODo 


o y Uo u : 


contig 


or 6163 bp in length 






oy iju : 


gap of 


unknown length 




59131 


65592: 


contig 


of 6462 bp in length 




65593 


65692: 


gap of 


unknown length 


* 


65693 


75313: 


contig 


of 9621 bp in length 


* 


75314 


75413: 


gap of 


unknown length 


* 


75414 


88948: 


contig 


of 13535 bp in length 




Location/ Qualifiers 




1. 


. 88948 







ORIGIN 



/organism="Homo sapiens" 
/mol_type="genomic DNA" 
/db_xref= M taxon: 9606" 
/ ch r omo s ome= " 5 " 
/clone="CTD-2330L9" 

/clone_lib="CalTech human BAC library D" 



Query Match 41.3%; 
Best Local Similarity 99.6%; 
Matches 960; Conservative 



Score 957.6; DB 2; 
Pred. No. l.le-242; 
0; Mismatches 4; 



Length 88948; 
Indels 0; Gaps 



0; 



Qy 


1357 


Db 


4584 


Qy 


1417 


Db 


4524 


Qy 


1477 


Db 


4464 


Qy 


1537 


Db 


4404 


Qy 


1597 


Db 


4344 


Qy 


1657 


Db 


4284 


Qy 


1717 


Db 


4224 


Qy 


1777 


Db 


4164 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 II II 1 1 II 1 1 1 1 1 1 1 1 



CCCCACACAGCGGCTGGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCA 147 6 
I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I II I 
CCCCACACAGCGGCTGGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCA 44 65 

CCTCAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGT 1536 
I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I 
CCTCAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAGCAGTACCTGCTCGACGTTTTTGT 4 4 05 

GTTTCTGCTGGGGCTCACTCTGGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGC 159 6 
I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I | | | | || | | | | || | 
GTTTCTGCTGGGGCTCACTCTGGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGC 4345 

TGTCTGGTGGCTGCGTGGGGCCAGAAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTG 1656 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGTCTGGTGGCTGCGTGGGGCCAGAAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTG 42 85 

GCGGGGTCTGTTTGGTGGGCGATGTCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCA 1716 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | I I I I I I I I I I I I I 
GCGGGGTCTGTTTGGTGGGCGATGTCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCA 4225 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 



AAAAATCATCCTTTCCACTTGCTAATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCT 18 36 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
TVAAAATCATCCTTTCCACTTGCTAATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCT 4105 



Qy 



1837 GCTAGCAGTVAATCTTTCCAGTCCTCTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATG 18 96 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 



Db 



4104 GCTAGCAGAATTCTTTCCAGTCCTCTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATG 4045 



Qy 


1897 


CTGTGATTCTGTCTCTGAGTGACTTGGACCACTGACCCTCAGATTTCCAGCCTTAAAATC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I || || 

CT GT GAT T CT GT CT CT GAGT GACTT GGACCACT GAC C CT CAGATTT C CAGC CT T AAAAT C 


1956 


Db 


4044 


3985 


Qy 


1957 


CACCTTCCTTCTCATGCGCCTCTCCGAATCACACCCTGACTCTTCCAGCCTCCATGTCCA 
1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II II 1 1 1 1 1 1 1 1 1 I 1 1 I | | | | | 
CACCTTCCTTCTCATGCGCCTCTCCGAATCACACCCTGACTCTTCCAGCCTCCATGTCCA 


2016 


Db 


3984 


3925 


Qy 


2017 


GAC CT AGT C AG C C T CT C T C AC TCCTGCCC CT AC TAT C TAT CAT G GAAT AAC AT C C AAGAA 

1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 
GAC CTAGT C AGCCT CT CT CACT C CT GCC C CT ACTAT CT AT CAT GGAAT AAC AT CC AAGAA 


2076 


Db 


3924 


3865 


Qy 


2077 


AGACACCTTGCATATTCTTTCAGTTTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCT 
1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I I I I I | | | | | | | | | | M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 
AGACACCTTGCATATTCTTTCAGTTTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCT 


2136 


Db 


3864 


3805 


Qy 


2137 


C AG GAAGC CTGCCCTGTGCTT GAGAGT T C AG GG C C G GAC AC AG G C T C ACAG GT C T C C AC A 

1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I I || I I I | | | | | | | | | | | | | | | | || | | | | | | | || 

CAGGAAGCCTGCCCTGTGCTTGAGAGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACA 


2196 


Db 


3804 


3745 


Qy 


2197 


TTGGGTCCCTGTCTCTGGTGCCCACAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGAC 

M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | | | || | | 1 | | | | | | | i | | 1 | 
' ■ ■ ■ ■ ■ • ■ ■ > ■ ■ ■ ■ i i i i i i i i i i i \ i i i i i i i i i i i i i i i 

TTGGGTCCCTGTCTCTGGTGCCCACAGTGAGCTCCTTCTTGGCTGAGCAGGCTTGGAGAC 


2256 


Db 


3744 


3685 


Qy 


2257 


TGTAGGTTTCCAGATTTCCTGAAAAATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCA 

M 1 1 1 M 1 1 1 1 1 II 1 II 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | I I | | | | | | | | [ | | | I | | | | | | 

TGTAGGTTTCCAGATTTCCTGAAAAATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCA 


2316 


Db 


3684 


3625 


Qy 


2317 


CTAA 2 32 0 




Db 


3624 


1 1 1 1 

CTAA 3621 





RESULT 14 

AC016612 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

REFERENCE 
AUTHORS 



Craniata; Vertebrata; Euteleos tomi ; 
Catarrhini; Hominidae; Homo. 



AC016612 179513 bp DNA linear PRI 06-SEP-2001 

Homo sapiens chromosome 5 clone CTD-2197M16, complete sequence. 
AC016612 

AC016612.6 GI: 154 5167 0 
HTG. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 179513) 

DOE Joint Genome Institute and Stanford Human Genome Center. 

Direct Submission 

Unpublished 

2 (bases 1 to 179513) 

DOE Joint Genome Institute. 
Direct Submission 

Submitted ( 04-DEC-1999 ) Production Sequencing Facility, DOE Joint 
Genome Institute, 2800 Mitchell Drive, Walnut Creek, CA 94598, USA 

3 (bases 1 to 179513) 

DOE Joint Genome Institute and Stanford Human Genome Center. 



TITLE 
JOURNAL 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Direct Submission 

Submitted (20-DEC-2000) DOE Joint Genome Institute, 2800 Mitchell 
Drive, Walnut Creek, CA 94598, USA 
4 (bases 1 to 179513) 

DOE Joint Genome Institute and Stanford Human Genome Center. 
Direct Submission 

Submitted ( 06-SEP-2001 ) DOE Joint Genome Institute, 2800 Mitchell 
Drive, Walnut Creek, CA 94598, USA 

On Sep 6, 2001 this sequence version replaced gi: 11908274. 
Draft Sequence Produced by DOE Joint Genome Institute 
www. jgi . doe . gov 

Finishing Completed at Stanford Human Genome Center 
www-shgc. stanf ord. edu 

Quality: Phrap Quality >=40 99.4% of Sequence; 
Estimated Total Number of Errors is 0.8. 
STS Content: 
SHGC-141485 G63682 
SHGC-104791 G58536. 

Location/Qualifiers 

1. .179513 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/ chromosome="5" 
/clone="CTD-2197M16" 



ORIGIN 



Query Match 41.3%; Score 957.6; DB 9; 

Best Local Similarity 99.6%; Pred. No. 1.2e-242; 
Matches 960; Conservative 0; Mismatches 4; 



Length 179513; 
Indels 0; Gaps 



0; 



Qy 1357 CAAGAGATACAAGTCCGCGGCAGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAG 1416 

Ml I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I 
Db 48 080 CAACAGATACAAGTCCGCGGCAGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAG 48139 

Qy 1417 CCCCACACAGCGGCTGGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCA 1476 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I II I I I II I I I 
Db 4814 0 CCCCACACAGCGGCTGGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCA 4 8199 

Qy 1477 CCTCAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGT 1536 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I M I I I I I I II I II I I I I I I I I I I I I I 

Db 48200 CCTCAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAGCAGTACCTGCTCGACGTTTTTGT 4 8259 



Qy 1537 GTTTCTGCTGGGGCTCACTCTGGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGC 1596 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I II I I 
Db 48260 GTTTCTGCTGGGGCTCACTCTGGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGC 48319 

Qy 1597 TGTCTGGTGGCTGCGTGGGGCCAGAAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTG 1656 

I I I I I M I I I I I I II I I I I I I I I I I I I M I I || I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 48 320 TGTCTGGTGGCTGCGTGGGGCCAGAAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTG 48379 

Qy 1657 GCGGGGTCTGTTTGGTGGGCGATGTCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCA 1716 

M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 8 380 GCGGGGTCTGTTTGGTGGGCGATGTCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCA 48439 



Qy 



1717 GCCCCATTCTCTAGTCCTTCTAGTTATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCC 177 6 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 4 8440 GCCCCATTCTCTAGTCCTTCTAGTTATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCC 48499 

Qy 177 7 AAAAATCATCCTTTCCACTTGCTAATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCT 1836 

M I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I It I I I I I | | I I | | | | | | 

Db 4 850 0 AAAAATCATCCTTTCCACTTGCTAATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCT 4 8 559 

Qy 1837 GCTAGCAGAAATCTTTCCAGTCCTCTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATG 18 96 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I | | | | | 

Db 4 8560 GCTAGCAGAATTCTTTCCAGTCCTCTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATG 4 8 619 

Qy 1897 CT GT GAT T CT GT CT CT GAGT GACT T GGACC ACT GAC C CT CAGATTT C CAGC CTT AAAAT C 1956 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I II I I I I II I I I 
Db 4 8 620 CTGTGATTCTGTCTCTGAGTGACTTGGACCACTGACCCTCAGATTTCCAGCCTTAAAATC 48679 

Qy 1957 CACCTTCCTTCTCATGCGCCTCTCCGAATCACACCCTGACTCTTCCAGCCTCCATGTCCA 2016 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | 
Db 48 680 CACCTTCCTTCTCATGCGCCTCTCCGAATCACACCCTGACTCTTCCAGCCTCCATGTCCA 48739 

Qy 2 017 GAC C T AGT C AG C CT C T C T C AC TCCTGCCCC TACT AT CT AT CAT GGAAT AAC AT C CAAGAA 2 07 6 

M I I I I I I II I I I II II I I I I I I II I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 4 8 740 GAC C TAG T C AG C C T C T C T C AC TCCTGCCCC T AC TAT C T AT CAT G G AAT AAC AT C CAAGAA 48799 

Qy 2077 AGACACCTTGCATATTCTTTCAGTTTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCT 213 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 8 800 AGACACCTTGCATATTCTTTCAGTTTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCT 48859 

Qy 2137 C AG G AAG CCTGCCCTGTGCTT GAGAGT T C AG G G C C G GAC AC AG G C T C AC AG GT C T C C AC A 2196 

I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | M 
Db 48860 CAGGAAGCCTGCCCTGTGCTTGAGAGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACA 48919 

Qy 2197 TTGGGTCCCTGTCTCTGGTGCCCACAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGAC 2256 

M M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I M 
Db 4 8 920 TTGGGTCCCTGTCTCTGGTGCCCACAGTGAGCTCCTTCTTGGCTGAGCAGGCTTGGAGAC 48979 

Qy 2257 TGTAGGTTTCCAGATTTCCTGAAAAATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCA 2316 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 48980 TGTAGGTTTCCAGATTTCCTGAAAAATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCA 49039 

Qy 2317 CTAA 2320 

I I I I 

Db 49040 CTAA 49043 



RESULT 15 

AX155213 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



AX155213 
Sequence 3 
AX155213 
AX155213. 1 



1569 bp 
from Patent WO0138505. 

GI:14536692 



DNA 



linear PAT 22-JUN-2001 



synthetic construct 
synthetic construct 
artificial sequences. 
1 

Adler,D.A., Dong, D . L . , Pownder,S., Gao,Z. and Conklin,D.C. 

Secreted protein, zalpha37 

Patent: WO 0138505-A 3 31-MAY-2001; 



ZymoGenetics, Inc. (US) 
FEATURES Location/Qualifiers 
source 1. .1569 

/organism=" synthetic construct" 
/mol_type="unassigned DNA" 
/db_xref = " taxon : 32 630 " 
/note="Degenerate sequence" 

ORIGIN 

Query Match 40.7%; Score 944.8; DB 6; Length 1569; 

Best Local Similarity 52.4%; Pred. No. 1.6e-239; 

Matches 822; Conservative 343; Mismatches 403; Indels 0; Gaps' 0 

Qy 68 ATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCTGCTCTCA 127 

I I I I I I I I : : I I I : I : I : I I I I I I : : I : I : | | | | : [ : | : : 
Db 1 ATGGTNGGNCARMGNGTNYTNYTNYTNGTNGCNTTYYTNYTNWSNGGNGTNYTNYTNWSN 60 

Qy 128 GAG G CT GC CAAAAT C C T GACAAT AT C T AC AGT AGGT G GAAG C CAT TAT C T AC T GAT G G AC 187 

I I : I I I I I I : I I : : I I I I I : : : I I I I I I I : : I I : I i : : I : | | | | : 
Db 61 GARGCNGCNAARATHYTNACNATHWSNACNYTNGGNGGNWSNCAYTAYYTNYTNYTNGAY 120 

Qy 188 CGGGTTTCT C AGAT T CT T CAAGAT CAC G GT CAT AAT GT C AC C AT GCT T AAC C ACAAAAGA 247 

: I I I : : I I : I I : : I I I : I I I I : I I I I : I I : I I I I I I I : I I : I I : | 
Db 121 MGNGTNWSNCARATHYTNCARGARCAYGGNCAYAAYGTNACNATGYTNCAYCARWSNGGN 18 0 

Qy 248 GGT C C T T T TAT G C C AGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AGT T G G C T T 307 

- I II II II: I : I I : I : I I : I I : II : : : I I : I I : I I I I : : I III I : 
Db 181 AART T Y YT NAT H C CN GAYATHAARGARGARGARAARW S NT AY C ARGTNAT HMGNT GGT T Y 240 

Qy 308 GC AC CT GAAGAT CAT C AAAGAGAAT T T AAAAAGAGT T T T GAT TTCTTTCTG GAAGAAACT 3 67 

: I I I I : I I : I I : I I : I : I : I I : I I : : I I : I I : : I : I I I : I 

Db 241 W S N C CN GARGAYC AYC ARAARMGNAT HAARAARC AYT T Y GAYW SN T AYAT H GARACN G CN 300 

Qy 368 TTAGGTGGCAGAGGAAAATTTGAAAACTTATTAAATGTTCTAGAATACTTGGCGTTGCAG 427 

: I I : I I : I : I : : II: : I III I III: : I I I I I : 

Db 301 YTNGAYGGNMGNAARGARWSNGARGCNYTNGTNAARYTNATGGARATHTTYGGNACNCAR 360 

Qy 42 8 T G C AGT CAT T T T T T AAAT AG AAAG GAT AT CAT G GAT T C CT T AAAGAAT GAGAACT T C GAC 4 87 

II::: I : : I : I : : I I I : I I : I I : I I I I I : : : : I M : I I : I I : I I : I : I I : 
Db 361 T G YW SNT AY YTN YT NW S NMGNAARGAYAT H AT GGAYW S N YTNAARAAYGARAAYTAYGAY 42 0 

Qy 488 ATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCTTGGGAAG 54 7 

Ml I I I I I : I I I : I I : I : I I : : I I : : I | | : | | 1 | : | | : : | | | | : 
Db 421 YTNGTNTTYGTNGARGCNTTYGAYTTYTGYWSNTTYYTNATHGCNGARAARYTNGTNAAR 480 

Qy 54 8 CCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCCC 607 

I I I I : I I I I I I I III I I I : II : : : I I I II : I I : I I I : II 

Db 4 81 CCNTTYGTNGCNATHYTNCCNACNACNTTYGGNWSNYTNGAYTTYGGNYTNCCNWSNCCN 54 0 

Qy 608 TTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTGGGGCCGA 667 

: I : : Ihll I I II II : I : : : I : I II I I : I I : I I I I I : I I : M I I I : I 
Db 541 YTNWSNTAYGTNCCNGTNTTYCCNWSNYTNYTNACNGAYCAYATGGAYTTYTGGGGNMGN 600 

Qy 668 GTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCAGTCTACA 727 

II I I : I I : I I : : I I I I I I : I I : : : I I : : : : I : : | | : | I : I I I I I : : : II 

Db 601 GTNAARAAYTTYYTNATGTTYTTYWSNTTYWSNMGNWSNCARTGGGAYATGCARWSNACN 660 



728 T T T G AC AAC AC CAT C AAG G AAC AT T T C AC AGAAG G C T C TAG G C C AG TTTTGTCT CAT C T T 78 7 

N • I I : II : | | I I : | | : I I : I I : I I : I I I : I I : : : I | | | | : | : s | | : : | 
661 TTYGAYAAYACNATHAARGARCAYTTYCCNGARGGNWSNMGNCCNGTNYTNWSNCAYYTN 72 0 

7 88 CTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCTCGACCT 847 

: 1 : I N : M I I : : I Mill: I I I : : : I I : M : I I I I : I I : | | : | | : | | | 
721 YTNYTNAARGCNGARYTNTGGTTYGTNAAYWSNGAYTTYGCNTTYGAYTTYGCNMGNCCN 78 0 

84 8 CTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACCAGTACCA 907 

: I : I H I I : I I M 11= I : I I II : I I I I I I : I I : I I I I : I I : | | | | | | 
781 YTNYTNCCNAAYACNGTNTAYATHGGNGGNYTNATGGARAARCCNATHAARCCNGTNCCN 84 0 

908 CAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGACCTTG 967 

I I : M : : I I I M : I I : I I : I I I I I I : I I I | : I I I I I : I | : | | | | | | 
841 CARGAYYTNGAYAAYTTYATHGCNAAYTTYGGNGAYGCNGGNTTYGTNYTNGTNGCNTTY 900 

968 G G C T C CAT G G T G AAC AC C T G T C AGAAT C C G G AAAT C T T C AAG GAG AT G AAC AAT G C C T T T 1027 

N :: III I Ihll :||:: I :||: | :| ||: |:||| |:||:|| || : 
901 GGNWSNATGYTNAAYACNCAYCARWSNCARGARGTNYTNAARAARATGCAYAAYGCNTTY 960 

1028 GCT CAC CT AC C C CAAG GG GT GAT AT GGAAGT GT C AGT GT T C T CAT T GG C C CAAAGAT GT C 108 7 
H I I : : I M Ihll II IhlMI | | : | | : : : : ; || : I I I I I : Ihll 
961 GCNCAYYTNCCNCARGGNGTNATHTGGACNTGYCARWSNWSNCAYTGGCCNMGNGAYGTN 1020 

108 8 CACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCAC 114 7 

I I : : I I I I 11:11 I I : I I : I I I I : I I I : I II | | : : : | I : : | : | | | | | : 
1021 CAYYTNGCNACNAAYGTNAARATHGTNGAYTGGYTNCCNCARWSNGAYYTNYTNGCNCAY 1080 

1148 CCAAGCAT C CGT CT GTTT GT CAC C C AC GGCGGGCAGAAT AGCATAAT GGAGGCCAT CCAG 1207 

N : ; I I : : I : I Ihll I I Ihll II Ihll::: I I I I I h I I | | :: 
1081 CCNWSNATHMGN YTNTT YGTNACNCAYGGNGGNCARAAYWSNGTNAT GGARG CNAT HMGN 114 0 

1208 CATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATGGTCCGA 1267 

Ihll II II I I I I I II Ml I : I I I I : I h I : , I h I I I I I : I 
1141 CAYGGNGTNCCNATGGTNGGNYTNCCNGTNAAYGGNGAYCARCAYGGNAAYATGGTNMGN 1200 

1268 GT AGAAGC CAAAAAGT TT GGT GT T T C TAT T C AGTTAAAGAAGCT CAAGGCAGAGAC AT T G 1327 

HI M I I : M I : I I I I : : | h : : I I I h I I I I I I I I : I 
12 01 GTNGTNGCNAARAAYTAYGGNGTNWSNATHMGNYTNAAYCARGTNACNGCNGAYACNYTN 1260 

1328 GCT C T T AAGAT GAAAC AAAT CAT G GAAGAC AAGAGAT AC AAGT C C G C G G C AGT GGC T G C C 1387 

I'M I M I I : I h I I I I h I I : II : : | | |: | | : : : | | | | | I I I I 
1261 ACNYTNACNATGAARCARGTNATHGARGAYAARMGNTAYAARWSNGCNGTNGTNGCNGCN 1320 

138 8 AGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGGATTGAC 14 4 7 

: : i i I I : : I I : : : II II : | : : | | | | | : : | s I | | | | | | | | |: I h 
1321 WSNGTNATHYTNCAYWSNCARCCNYTNWSNCCNGCNCARMGNYTNGTNGGNTGGATHGAY 138 0 

14 4 8 CACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCAGCCCTGG 1507 

lh h:| Ihll || || || || ||::| || : || || : | Ihlhlhll III 
1381 CAYATHYTNCARACNGGNGGNGCNACNCAYYTNAARCCNTAYGCNTT YCARCARCCNTGG 14 4 0 

1508 CATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGGGACTCTA 1567 

I h I h I h I h : I h I h I I Ihll I h : I : | | | : | | | : | | | | | | 
1441 CAYGARCARTAYYTNATHGAYGTNTT YGTNTT YYTNYTNGGNYTNACN YTNGGNACNATG 15 00 

1568 TGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAGAAAGGTG 1627 



111 = 1 11:11- M::l = I I I I I : I : I I I I I : I ||:| 

Db 1 5 °1 TGGYTNTGYGGNA7VRYTNYTNGGNGTNGTNGCNMGNTGGYTNMGNGGNGCNMGNAARGTN 1560 

Qy 1628 AAGGAGAC 1635 

II: I : I I 
Db 1561 AARAARAC 1568 



Search completed: May 16, 2004, 11:35:04 
Job time : 14326 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



May 16, 2004, 00:20:03 ; Search time 1303 Seconds 

(without alignments) 
7563.944 Million cell updates/sec 

US-10-017-867A-281 
2320 

1 agggtcccttagccgggcgc tctctccccaacctcactaa 2320 

IDENTITY__NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 3373863 seqs, 2124099041 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



6747726 



Post-processing: 



Database : 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



N_Geneseq_2 9Jan04 : * 

1 : geneseqnl9 8 0s : * 

2: geneseqnl990s : * 

3 : geneseqn2000s : * 

4 : geneseqn2001as : * 

5 : geneseqn2001bs : * 

6: geneseqn2002s : * 

7: geneseqn2003as : * 

8 : geneseqn2003bs : * 

9 : geneseqn2003cs : * 

10: geneseqn2004s : * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 
AAC58107 

ID AAC58107 standard; cDNA; 2320 BP. 
XX 

AC AAC58107; 
XX 

DT 25-JAN-2001 (first entry) 
XX 

DE Human PRO1780 nucleotide sequence SEQ ID NO: 12. 
XX 

KW Human; tumour; diagnosis; neoplastic disease; proliferation; cancer; 

KW identification; tumourigenesis ; anticancer; detection; ss. 

XX 

OS Homo sapiens . 



XX 
PN 
XX 
PD 
XX 
PF 
XX 
PR 
PR 
PR 
PR 
PR 
XX 
PA 
XX 
PI 
XX 
DR 
DR 
XX 
PT 
PT 
PT 
XX 
PS 
XX 

cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 

XX 
SQ 



WO200053750-A1. 
14-SEP-2000. 

02-DEC-1999; 99WO-US028551 . 



08-MAR-1999 
01-SEP-1999 

29- OCT-1999 

30- NOV-1999 
01-DEC-1999 



99WO-US005028. 
99WO-US020111. 
99US-0162506P. 
99WO-US028313. 
99WO-US028634 . 



(GETH ) GENENTECH INC. 

Botstein D, Goddard A, Gurney AL, Roy MA, Watanabe CK, Wood WI ; 

WPI; 2000-594320/56. 
P-PSDB; AAB24025. 

Antibodies specific for PRO polypeptides, used to diagnose and inhibit 
the growth of tumors in mammals, and to identify inhibitors of PRO 
polypeptide activity or expression. 

Claim 50; Fig 9; 226pp; English. 

The present invention describes an antibody that binds to a human protein 
(I) selected from: PR0381; PR01269; PRO1410; PR01755; PRO1780; PR03434; 
PR01927; PR03567; PR01295; PR01293; PRO1303; PR04344; PR04354; PR04397; 
PRO4407; PR01555; PRO1096; PRO2038; and PR02262. (I) has anticancer 
activity and can be used to diagnose tumours in mammals, by detecting 
complex formation when the antibody is contacted with test cells. 
Increased expression of genes encoding (I) can also be detected to 
diagnose tumours. Agents which inhibit the activity of (I), especially 
the antibodies, or an antisense oligonucleotide which hybridises to genes 
encoding (I), can be used to inhibit tumour growth, preferably by 
inducing cell death. Methods from the present invention can be used to 
identify compounds which inhibit the biological activity of (I) . AAC58019 
to AAC58102 represent PCR primers and hybridisation probes used in 
examples from the present invention for human PRO sequences. AAC58103 to 
AAC58122 and AAB24021 to AAB24040 represent human PRO polynucleotide and 
protein sequences given in the exemplification of the present invention 

Sequence 2320 BP; 545 A; 581 C; 538 G; 656 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2320; DB 3; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I I M I I I I I I I I || I I I I I I M I I I I I I I I II I I I I I | I I | I || | | | I I | | 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

N M I I I I I I II I I I I I I || || I I I | | | | | | | | || | | | | | | | | | | | | | | | | | | | | | | | | | 

Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 



Qy 


121 


G CT C T CAGAGGCT GC CAAAAT C C T GACAAT AT CT AC AGT AGGT G GAAG C CAT T AT CT AC T 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 I I M | | | M 1 1 1 1 1 1 1 1 1 M | | | | M 1 1 1 

G C T CT CAGAGGCT GC CAAAAT C C T GACAAT AT CT AC AGT AGGT GGAAG C CAT TAT C TACT 


180 


Db 


121 


180 


Qy 


181 


GAT GGAC CGGGTTTCT C AGAT T C T T C AAGAT C AC GGT C AT AAT GT CAC CAT G C T T AAC C A 

1 1 1 1 II II II 1 1 II 1 1 II 1 1 1 1 1 1 1 I | I | | || | | || | | | | | | | | | | | | || | | | | | 

GAT GGAC CGGGTTTCT C AGAT T C T T CAAGAT CAC GGT CAT AAT GT CAC CAT G C T T AAC C A 


240 


Db 


181 


240 


Qy 


241 


CAAAAGAG GT C C T TT TAT GC C AGAT T TTAAAAAGGAAGAAAAAT CAT AT CAAGT TAT CAG 

1 M 1 1 1 1 II M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I || I || | || | | | | | | | | | | | | | | | | | | 

CAAAAGAG GT C CT T T TAT G C C AGAT T T TAAAAAGGAAGAAAAAT CAT AT CAAGT TAT CAG 


300 


Db 


241 


300 


Qy 


301 


TTGGCTTG CAC C T GAAG AT CAT C AAA GAG AAT T T AAAAAG AG T T T T GAT TTCTTTCTG G A 

1 1 1 M 1 1 II 1 1 1 1 1 II 1 1 1 1 1 I I I | | | | | | | | | || | | | | | | | | | | | | | || | | | | || | | | | 

TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 


360 


Db 


301 


360 


Qy 


361 


AGAAACT T TAGGT GGCAGAGGAAAAT TT GAAAACT TATT AAAT GTT CT AGAATACTT GGC 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I | | | | | | | | | || | | | | | | | | | | | || | | | | | 

AGAAACT T TAG GT GGC AGAG GAAAAT T T GAAAACT TAT T AAAT GTT CT AGAAT AC T T G G C 


420 


Db 


361 


420 


Qy 


421 


GT T GC AGT G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C CT T AAAGAAT G AGAA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I I I I | | | | | | | | | || | | 
GT T G CAGT GC AGT CAT T T T T TAAAT AGAAAG GAT AT CAT G GAT T C CT T AAAGAAT G AGAA 


480 


Db 


421 


480 


Qy 


481 


CT T C GACAT G GT GAT AGT T GAAACT T T T GAC TACT GTCCTTTCCT GAT T G CT GAGAAGCT 

1 1 II 1 M 1 i i II I 1 i 1 I II 1 M I 1 I 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | | | 

CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 


540 


Db 


481 


540 


Qy 


541 


TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 

1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 
TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 


600 


Db 


541 


600 


Qy 


601 


AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 I I | I | | | | | | 
AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 


660 


Db 


601 


660 


Qy 


661 


GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 

1 1 1 II 1 1 1 1 1 1 1 1 I I I I | | | | | | | | | | | | | | | | | | | M | | | | | | | | | | | 

GGGC C GAGT GAAGAAT T T T C T GAT GT T CT T T AGTT T CT GC AGGAGG CAAC AG CAC AT GC A 


720 


Db 


661 


720 


Qy 


721 


GT C T AC AT T T GAC AAC AC CAT C AAG G AAC AT T T C A C AG AAG G C T C TAG G C CAGT T T T G T C 

1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | | | | | | | || | | | | | | | | | | | 

GT CT AC AT T T GAC AAC AC CAT CAAG GAAC AT TT CACAGAAG GC T CTAG GC CAGT T T T GT C 


780 


Db 


721 


780 


Qy 


781 


TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 

1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 I I I I I I I | | M 1 1 1 1 1 1 1 1 I 1 I I I | | 1 1 II 1 1 1 
TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 


840 


Db 


781 


840 


Qy 


841 


TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 
1 M 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I | M | | | | | | | | | | | | | | 
TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 


900 


Db 


841 


900 


Qy 


901 


AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II I 1 I I | I | | I || | 

AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 


960 


Db 


901 


960 


Qy 


961 


GAC CTTGGGCTC CAT GGT GAAC AC C T GT CAGAAT C C G GAAAT C T T CAAGGAGAT GAAC AA : 


1020 



961 GAC CTTGGGCTC CAT G GT GAAC AC C T GT C AGAAT C C G GAAAT CT T C AAGGAGAT GAAC AA 1020 
1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

M I I I I I I ! I M I I I I I I I I I I I | I | I ! I I I I I ! I I I I I I I I M I I I I I I I I I I I I I I I I 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

I I I M I I I I I I I I I I I I I I I I I | | | I I I II I I I I I I I I I I I I | | | | | | | | | | I I I I I I I I 
1081 AGAT GT C CACCT GGCT GCAAATGT GAAAAT T GT GGACT GGCT TCCT CAGAGT GAC CT CCT 1140 

1141 GGCT C AC C CAAGC AT C C GT CTGTTTGT C AC C C AC GG C GGG CAGAAT AGC AT AAT G GAGGC 1200 

N I I I I I I I I I I I I I I I I I I I I I | | | | M I I I I I I I I I I II I I I I I I I II I I I I I I I I I I 

1141 GGCT C AC C C AAG CAT CCGTCTGTTTGT C AC C C AC G G C G G G CAGAAT AG CAT AAT G GAG G C 1200 
1201 CAT C CAGCAT GGT GT GC CCAT GGT GGGGAT CC CT CT CTT T GGAGAC CAGC CT GAAAACAT 1260 

1 I M M I I I I I I I I I I I I I I I I I | | | | | | I I I I I I I I I I I I I I | | | | | M | | | | | | | | | | 

1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 
1261 G GT C C G AGT AGAAG C C AAAAAGT TTGGTGTTTC TAT T C AG T T AAAGAAG C T C AAG G C AG A 1320 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 132 0 
1321 GAC AT T G G C T CT T AAGAT GAAAC AAAT C AT GGAAGAC AAGAG AT AC AAGT C C G C GG C AGT 1380 

I I M I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

1321 GACAT T GGCT CT TAAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT C C GC GGCAGT 138 0 
1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

M I I I I M I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 
1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 15 00 

I N I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I 

1441 GAT T GAC C AC GT C C T C C AG AC AG G G G G C G C GAC G C AC C T C AAG C C C TAT GT C T T T C AG C A 1500 
15 01 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

N I I M I I II I I I I I I I I II I I I II I I I I I I I I I I | | | | | | | | | | M II I II I II I I I I I 
1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I M I I II I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I 
1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

M I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I M I I | | | | | | | | | | | | | | 
1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | I I I I I I I II I 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
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ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGA7UVTCTTTCCAGTCCT 


1860 


Qy 


1861 


CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 

1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II I || | | | M 1 1 1 1 1 1 1 I I I I || | || | | | | | | | | | 

CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 
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Db 
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Qy 
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TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 

M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 I I | | | | || | | | | | | | | | | 

TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 


1980 


Db 


1921 
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Qy 


1981 


CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 
1 1 1 1 1 1 M i 1 I 1 1 1 1 1 1 I I | | I | | | | 1 1 i 1 1 1 I I | | | | | | | | | | | | | | | | M | | | | | | | | 

CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 


2040 


Db 


1981 


2040 


Qy 


2041 


T G C C C C T AC TAT C TAT CAT G G AAT AAC AT C C AAG AAAG AC AC C T T G CAT AT T C T T T C AG T 
1 N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 I I I I I | | | | | | | | | | | | | | | | 
T G C C C C TACT AT C TAT CAT G GAAT AAC AT C C AAGAAAG AC AC C T T G CAT AT T C T T T C AGT 


2100 


Db 


2041 


2100 


Qy 


2101 


TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 
1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 I I I | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 
TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 


2160 


Db 


2101 


2160 


Qy 


2161 


AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 

1 N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I M 1 1 1 

AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 


2220 


Db 


2161 


2220 


Qy 


2221 


C AGT GAGCT C CTTCTTGGCT GAGCAGGCAT G GAGAC T GT AG GT T T C C AGAT T T C C T GAAA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | 1 i 1 | i j i i j i i i i i it i i i i i i i i i t i i i 

1 1 1 1 1 1 1 1 1 1 1 1 'I 1 I' 1 1 1 1 II 1 M 1 11 II 1 1 1 It 1 1 1 1 1 I I | | | 1 1 | | | | | | | | || | | 

CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 


2280 


Db 


2221 


2280 


Qy 


2281 


AAT AAAAGT T T AC AG C GT TAT CT C T C C C C AAC CT C AC T AA 2320 
1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | | | 
AAT AAAAGT T T AC AGC GT T AT CT C T C C C C AAC CT C ACT AA 232 0 
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2281 
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New mammalian DNA sequences encoding transmembrane, receptor or secreted 
PRO polypeptides, useful for screening of potential peptide or small 
molecule inhibitors of the relevant receptor/ligand interactions. 



PR 18-NOV-1998; 98US-010884 8P . 

PR 18-NOV-1998; 98US-0108 849P . 

PR 18-NOV-1998; 98US-0108 850P . 

PR 18-NOV-1998; 98US-0108851P . 

PR 18-NOV-1998; 98US-01 08 852 P . 

PR 18-NOV-1998; 98US-0108858P . 

PR 18-NOV-1998; 98US-0108 904P . 
XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Baker K, Goddard A, Gurney AL, Smith V, Watanabe CK, Wood WI; 
XX 

DR WPI; 2000-237871/20. 

DR P-PSDB; AAY99419. 
XX 
PT 
PT 
PT 
XX 

PS Claim 2; Fig 159; 773pp; English. 
XX 

CC AAA37022 to AAA37144 encode the new isolated human transmembrane, 

CC receptor or secreted PRO polypeptides given in AAY99340 to AAY99462. The 

CC transmembrane and receptor PRO proteins can be used for screening of 

CC potential peptide or small molecule inhibitors of the relevant 

CC receptor/ligand interactions. The polypeptides and nucleotide sequences 

CC encoding then have various industrial applications, including uses as 

CC pharmaceutical and diagnostic agents. AAA37145 to AAA37330 represent PCR 

CC primers and hybridisation probes used in the isolation of the PRO 

CC polypeptides from the present invention 

XX 

SQ Sequence 2320 BP; 545 A; 581 C; 538 G; 656 T; 0 U; 0 Other; 

Query Match 100.0%; Score 2320; DB 3; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 232 0; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

QY 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I i I I I I I I I I I I I I I I I I I I I II I I I I I | | | | | I I I I I I I I I I I I II I I I M I I I I I I I 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

QY 121 G C T C T C AGAG G C T G C C AAAAT C C T G AC AAT AT C T AC AGT AG G T G G AAG C CAT TAT C T AC T 180 

I I I I I I I I I I I I I I I I I I I I I I I I | I | I I I I I I I I I I I I I | | | | | | | | | | | I I I I I I I I I 

Db 121 GC T CT C AGAG G C T G C CAAAAT C C T GACAAT AT C T AC AGT AG GT GGAAG C CAT TAT C T AC T 180 

Qy 181 GAT G GAC CGGGTTTCT C AGAT T C T T C AAG AT C AC G GT CAT AAT GT C AC CAT G C T T AAC C A 240 

I I I M I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIMUM 

Db 181 GAT G GAC CGGGTTTCT C AG AT T C T T C AAGAT C AC G G T CAT AAT GT C AC CAT G C T T AAC C A 24 0 

Qy 241 C AAAAG AG GT C C T T T TAT GC C AG AT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT C AG 300 

I N II I II II M I II II M I II M I II II II I I II I I I I I II I 

Db 241 CAAAAGAG GT C C TT T TAT G C C AGATT T TAAAAAGGAAGAAAAAT CAT AT CAAGT TAT CAG 3 00 



301 TTGGCTTG C AC C T G AAGAT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 3 60 

I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I | I I I I 

3 01 TT G G C TT GC AC CT GAAGAT CAT CAAAGAGAAT T T AAAAAG AGT T T T GAT TTCTTTCT GGA 3 60 
361 AG AAAC T T TAG G T G G C AG AG G AAAAT T T G AAAAC T TAT T AAAT GT T C TAG AAT AC T T G G C 420 

I N I I I I I I I I I I I I I M I I M I I I I I I I I II I I I I I I I I I I I I I I I I I | I | | I I | | | | | 

361 AGAAAC T T TAG G T G G C AG AGGAAAAT T T GAAAACT TAT T AAAT GT T C T AGAAT AC T T G G C 42 0 

421 GT T G C AG T G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAG AAT G AGAA 4 80 

M M I I I I I I I I I I I I I I I I I I I II I II I I I I II I I I I I I I I I I I I I I I I I I I I I 

421 GT T G C AGT G C AGT CAT TT T T T AAAT AGAAAGG AT AT CAT G GAT T C CT T AAAGAAT GAGAA 480 

4 81 CT T C GACAT GGT GAT AGT T GAAACT T TT GACT ACT GTCCTTTCCT GATT G CT GAGAAG C T 540 

M I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I 

481 C T T C GACAT GGT GAT AGT T G AAAC T T T T GAC T AC TGTCCTTTCCT GAT T G C T GAGAAG C T 54 0 

541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I II I I I I I I I II I I I I I I I I II I I 
541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | | | | I I I I I I I I II | | 
661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

721 GT CT AC AT T T GAC AAC AC CAT C AAG GAAC AT T T C AC AGAAGG C T CT AG G C C AGT T T T GT C 78 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I II I I II I I I 

721 GT CT ACAT T T GACAACAC CAT CAAG GAAC AT T T C ACAGAAG GC T CT AG G C C AGT T T T GT C 78 0 

7 81 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I I I I I I I i f I I I I | | | | | | | | | | | | | | | M I I I I I I I I I | | | I I I I I I I I I I I I I | | 
781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 90 0 

901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

M I I I M I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 AGT ACC ACAAGAC TT G GAGAACT T CAT T GC CAAGT T T G GGGAC TCTGGTTTTGTCCTT GT 960 

961 GAC CTTGGGCTC CAT GGT GAAC AC C T GT C AGAAT C C G GAAAT C T T C AAGGAGAT GAAC AA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I 
9 61 GACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGAGATGAACAA 102 0 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 10 8 0 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II II I I I I 
1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

1141 G GCT CAC C CAAG CAT C C GT C T GT T T GT CAC C CAC GG C GG GC AGAAT AG CAT AAT G GAG GC 12 00 



1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

1201 CAT C CAGCAT GGT GT G C C CAT GGT GGG GAT CCCTCTCTTT GGAGAC C AG C C T GAAAAC AT 1260 

I I M II I I I I I | | | | M I I I I I I I I II I II I I I I | | || | | | M I I II I I I I I I I I I | I I I 
1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

1261 G GT C C G AGT AGAAG C C AAAAAGT TTGGTGTTT C T AT T C AG T T AAAGAAGC T C AAG G C AG A 1320 

N I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I II I I I II I I II I I I I I II I I 

1261 G GT C C GAGTAGAAG C C AAAAAGT TT GGT GTT T C TAT T C AGTT AAAGAAG CT CAAG GC AGA 1320 

1321 GAC AT T G G C T CT T AAG AT G AAAC AAAT CAT G GAAGAC AAG AG AT AC AAG T C C G C GG C AGT 1380 

I I I M I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | I I I I 
1321 GAC AT T G G C T C T T AAG AT G AAAC AAAT CAT G GAAGAC AAG AG AT AC AAGT C C G C G G C AGT 1380 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

I I I I I I I M I I I I I I I I I I I I I I I II I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 
1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I 

1441 GAT T GAC CAC GT C C T C C AGAC AGGGGG C G C GACGC ACC T CAAGC C CT AT GT C T T T CAGC A 1500 
1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | f | | | | 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 
1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

N I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | || | | | | | | | | | | | | | | | | | | | | 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1 62 0 
1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

N I M I I I I I I I I I I I I I I I I I I II I I I II I I I II I I I I I II I I I I I I I I 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I | | | | | | | | | | | | | | | 
1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

M I I I M M I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I I M I I I I I I I I || I | | | | | | | | | | || | | M II I I I I I I I I I I I | | | | | | | | | | 

1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

I I I I I I I I N I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

I M I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | || | | | || || | | | 

1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 204 0 
I I I Ml I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I II 



1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 204 0 

2041 TGCCCCTACTATCTATCATGGAATAACATCCAAGAAAGACACCTTGCATATTCTTTCAGT 2100 

I I I I M I I I I I I II I I I I I I | | M || | | || | | | | | | , | I I I I I I I I I I I I I I I I I 

2041 TGCCCCTACTATCTATCATGGAATAACATCCAAGAAAGACACCTTGCATATTCTTTCAGT 2100 

2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

M I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

MMI I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 

I N I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 AAT AAAAGTTT ACAGC GTTAT CTCT C CCC AACCT CACTAA 2320 
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ID 
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XX 






AC 
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XX 






DT 
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XX 






DE 


Primer #82 
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XX 




KW 
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XX 






OS 
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XX 






PN 
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-Al. 


XX 






PD 
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XX 






PF 
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XX 






PR 


23-JUN-1999 


99US-0141037P. 


PR 


20-JUL-1999 


99US-0144758P. 


PR 


26-JUL-1999 


99US-0145698P. 


PR 


01-SEP-1999 


; 99WO-US020111. 


PR 


29-OCT-1999 


99US-0162506P. 


PR 


30-NOV-1999, 


99WO-US028313. 


PR 


02-DEC-1999, 


99WO-US028551. 


PR 


16-DEC-1999, 


99WO-US030095. 


PR 


05-JAN-2000, 


2000WO-US000219. 


PR 


06-JAN-2000, 


2000WO-US000376. 


XX 






PA 


(GETH ) GENENTECH INC. 


XX 






PI 


Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



PI Gao W, Goddard A, Godowski PJ, Grimaldi CJ, Gurney AL, Hillan KJ; 

PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 

PI Williams PM, Wood WI; 
XX 

DR WPI; 2001-071395/08. 



XX 

PT Secreted and transmembrane proteins and nucleic acids designated PRO, 

FT useful as hybridization probes, in chromosome and gene mapping and gene 

PT therapy. y 
XX 

PS Example 82; Page 456; 787pp; English. 
XX 

cc m?! P^^^.^^tiori relates to secreted and transmembrane proteins, 

CC 
CC 



^ wv ^ww^v-^v-v^ uxauoiLiciiujiciut; pioueins. 

These proteins and the DNA encoding them may be used as hybridization 
probes, in chromosome and gene mapping and in the generation of anti- 
sense RNA and DNA. They may also be used used to generate either 
CC transgenic animals or knockout animals which are in turn useful for 
cn development and screening of therapeutically useful reagents. The nucleic 
acids may also be used in gene therapy 



CC 
CC 
XX 

SQ Sequence 2320 BP; 545 A; 581 C; 538 G; 656 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2320; DB 4; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 


1 


AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 

1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I M II 1 1 1 M 1 1 1 1 I I I I | | | | | M 1 1 1 

AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 


60 


Db 


1 


60 


Qy 


61 


AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | II 1 1 1 1 1 1 1 1 

AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 


120 


Db 


61 


120 


Qy 


121 


G C T C T C AG AG G C T G C C AAAAT C C T G AC AAT AT C T AC AG T A G G T G G AAG C CAT TAT C T AC T 

1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GCT CT CAGAGGCTGC CAAAAT CCT GACAATAT CTACAGTAGGTGGAAGCCAT TAT CTACT 


180 


Db 


121 


180 


Qy 


181 


GAT G G AC CGGGTTTCT C AGAT T C T T C AAGAT C AC G G T CAT AAT GT C AC CAT GC T T AAC C A 

1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I II 1 1 1 M I 

GAT GGAC CG GGTT T CT C AGAT T CT T CAAGAT CAC GGT C ATAAT GT CAC C AT GC T T AAC C A 


240 


Db 


181 


240 


Qy 


241 


C AAAAGAG GT C C T T T TAT G C C AGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT T AT C AG 

N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 

C AAAAGAG G T C C T T T TAT G C C AG AT T T T AAAAAG GAAGAAAAAT CAT AT C AAG T TAT C AG 


300 


Db 


241 


300 


Qy 


301 


T T GGCTT GCAC CT GAAGAT CAT CAAAGAGAAT TT AAAAAGAGT T TT GAT T T CT T T CT GGA 

1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 

TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 


360 


Db 


301 


360 


Qy 


361 


AGAAAC T T TAG GT G GC AGAGGAAAAT T T GAAAAC T TAT T AAAT GT T C T AGAAT AC T T G G C 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I | I I I I M | | 1 1 

AGAAAC T T T AGGT G G CAGAG GAAAAT T T GAAAAC T TAT TAAAT GT T C T AGAAT AC T T G G C 


420 


Db 


361 


420 


Qy 


421 


G T T G C AG T G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT GG AT T C C T T AAAG AAT G AGAA 

1 1 M 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 

GT T GC AGT G C AGT CAT T T T T TAAAT AGAAAGGAT AT CAT GGAT T C C T T AAAGAAT GAG AA 


480 


Db 


421 


480 



481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 540 

I I M I I I I I I I I I I I I I I I I I I I | | | | N | I I I I I I I I I I I I I I I I I | | M I I I I I I I I I 

4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 
541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I M I I I I I M I I I M I I II I MINIMUM M I M II I II II I II I M 

541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I' N M I II I I II I II I I I I I I I I I I | | | || || | || || | | | | || | | | | | || | || 

601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

M M M I I II II II M M II II I I I II II II M M I II II II I I I I || 

661 G G G C C GAG T G AAG AAT T T T C T GAT GT T C T T T A G T T T C T G C AG GAG G C AAC AG C AC AT G C A 72 0 

721 GT CT AC AT T T GAC AAC AC CAT CAAGGAAC AT T T C AC AG AAG GC T C TAG G C C AGT T T T GT C 78 0 

I I I I I M I II I II I I I I I I I I I I I I I | | | | || | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

721 GT C T AC AT T T GAC AAC AC CAT C AAG GAAC AT T T C AC AGAAG G C T C TAG G C C AG T T T T GT C 780 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

M I M M M II I II II II I I I I I I I || I || || | || | || | | | || || || | || || | 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I I I M M I I I I I I I I M M I I I I I I I I I I I II II I II I I M I I II I I I I I I I I I I I I I I 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 
901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I Ml M II II II II I I I II I II I I I II | || || | || || || | | || | | 

901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

961 GAC CTTGGGCTC CAT G GT GAAC AC C T G T C AGAAT C C G G AAAT C T T C AAG G AGAT GAAC AA 102 0 

M I I I I I I I II I I II I II II I I I || I II II I II I II I I I I || | | || | || || || || 

961 GAC C T T GGGC T C CAT GGT GAAC AC C T GT C AGAAT C C GGAAAT C T T CAAGGAGAT GAAC AA 1020 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I M M II I M II II II I I I II I || | | | | | | || | | | || || || || | || || || || | || || | || 
1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I M M II I I M II II II M M II I I I II M II I I II II I II II M M II II II II 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

I I N M I II I I I I I I I I I | M || | | || M I II I II M I I I I I I I || | I I || | || | | M I I 
1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

I I I I I I I I I I I I I I M I I I I I I I I I | M II II I I I I M II I II I I I II I I I I I I I I I I II 

12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

12 61 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 132 0 

I I N N II I I I I I I I I I I I I I I I I I I M II I I I I M I II I I I I M II I I I I I II I I II II 
12 61 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGTyVGCTCAAGGCAGA 132 0 



1321 GACATTGGCTCTTAAGATGAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT 1380 

I I I M I II I I I II I I I I I II I I II I I I I I | | || || || | | | | | | | | | | | 

1321 GACATTGGCTCTTAAGATGAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT 1380 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I 
1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | || | | | | | | | | | | II I I 

1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

N I I I I I I I I I I I I I I I I I I I I II I I II I I M I I I | | | | | | | | | | | | | | | | | | | | | | | | | 
1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

15 61 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I | | | | | | | | | | I I I I I I I 
1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

I I I I I I I I I I N I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I | I I I I I I I I I 
1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I I I I I M I I I I I I I I I I I I I I I I I I | | I I I I I I I I I I I I I I I I I I I II I I I I I I 

1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I I M I I I I I I I I I I I I I I I I I I I II I I I II I I II I I I I I I I I 

1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I I I I I I I I I I I I 
1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 204 0 

I I I I I I I I I I I I I I I I M I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

2041 TGCCCCTACTATCTATCATGGAATAACATCCAAGAAAGACACCTTGCATATTCTTTCAGT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 TGCCCCTACTATCTATCATGGAATAACATCCAAGAAAGACACCTTGCATATTCTTTCAGT 2100 

2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 



Db 


2161 


1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 i 1 1 I 1 1 1 1 

AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 


Qy 


2221 


CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 

N 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M I | | I M | M | | | | | M 1 1 1 1 II 1 1 1 1 1 1 

CAGT GAGCT C CT T CT T GGCT GAGCAGGCAT GGAGACT GT AGGTT T C CAGAT T T C CT GAAA 2280 


Db 


2221 


Qy 


2281 


AAT AAAAGT T T AC AGC GT TAT C T CT C C C C AAC C T C AC T AA 232 0 
N 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 || I || | | | | | | 
AAT AAAAGT T T AC AG C G T TAT CTCT CCCCAACCT CACTAA 2320 


Db 


2281 
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ACD68440; 

17-SEP-2003 (first entry) 

Novel human secreted and transmembrane protein PRO1780 cDNA. 

Human; secreted and transmembrane protein; PRO; angiogenesis ; 
endothelial cell proliferation; wound healing; immune response; 
T-lymphocytes proliferation; neonatal heart hypertrophy; tumour; 
cardiac insufficiency disorder; calcium flux; inflammation; 
vascular endothelial growth factor-stimulated proliferation; 
mammalian kidney mesangial cell proliferation; Berger disease; 
nephropathy; Schanlein-Henoch purpura; celiac disease; Crohn's disease; 
dermatitis herpetiformis; diabetes; haemoglobin switch; insulinaemia ; 
pancreatic beta-cell precursor cell differentiation; thalassemias; 
obesity; auditory hair cell regeneration; hearing loss; bone disorder; 
cartilage disorder; sports injury; arthritis; gene; ss. 

Homo sapiens. 
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(GETH ) GENENTECH INC. 

Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 
Gao W, Goddard A, Godowski PJ, Grimaldi J.C f Gurney KL, Hillan KJ; 
Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 
Williams PM f Wood WI ; 

WPI; 2003-585293/55. 
P-PSDB; AB033661. 

Novel isolated PRO polypeptides e.g. PRO1130, PR01275, PR01418, PR01555, 
PR01787 that modulate glucose or free fatty acid uptake by skeletal 
muscle cells, and are useful for treating diabetes, hyper- or hypo- 
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Qy 
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1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

, 1 ' 1 1 1 J 1 r ' ■ r i j 1 1 1 1 1 1 1 1 f 1 1 r i f j i r 1 1 1 r i r 1 1 1 1 1 1 j 1 1 1 1 1 f 1 1 1 1 1 1 1 r 1 1 1 

1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 



61 



AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

llllllll| lllllllllllllllll|||||||||||IIMIIIIIIIIIIIIIIIIIII 

AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 
121 G C T C T C AG AGG C T G C CAAAAT C C T GACAAT AT CTAC AGT AG GT G GAAG C CAT TAT C T AC T 180 



61 



121 GCTCTCAGAGGCTGCCAAAATCCTGACAATATCTACAGTAGGTGGAAGCCATTATCTACT 18 0 

181 GAT G GAC CGGGTTTCT C AGAT T C T T C AAGAT C AC G GT C AT AAT G T C AC CAT G C T T AAC C A 24 0 

Him I I II M I II I I II I I II I I I I I II I I I I | | | | | | | | | | | I | | 

181 GAT GGAC C GGGT TT CT CAGATT CT T CAAGAT CAC GGT CAT AAT GT CAC CAT GCT T AAC C A 24 0 

241 C AAAAGAGGT CCTTT TAT GC CAGAT TTT AAAAAGGAAGAAAAAT CAT AT CAAGTTAT CAG 300 

I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I Ill 

2 41 C AAAAG AG G T C C T T T TAT G C CAGAT T T T AAAAAG G AAG AAAAAT CAT AT C AAG T TAT CAG 3 00 
301 TTGGCTTG CAC C T G AAG AT CAT C AAAG AGAAT T T AAAAAG AG T T T T GAT TTCTTTCTG G A 360 

I I I I I I I I I I I I I I I | | | | | | | || | | | | | m I I I I I II I I I | | | | M II I I I II I 

301 TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 3 60 

361 AGAAAC T T TAG GT G G C AGAG GAAAAT T T GAAAACT T AT T AAAT G T T C T AGAAT AC T T G G C 420 

N I M I I M I I I I I I I I M I M I I I I I MM I I I I I I I I I I I I I I I I I II 

361 AGAAACT T TAG G T G G CAG AG GAAAAT T T GAAAAC T TAT T AAAT GT T CT AGAAT AC T T G G C 420 

421 GT T G CAG T G CAG T CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT GAGAA 4 8 0 

N M I I I I I II I I I I I I I I I I I I I II I I I I I I I Ml I I I I I II I I I I I I I I I I I I I I I I I 

421 GT T G C AGT G CAG T CAT T T T T T AAAT AG AAAG GAT AT CAT G GAT T C C T T AAAG AAT GAGAA 480 

4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I I I II I I II I I M I M I I M M M M I I I I II III II I I I II I I II II II II I I I II I 
481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I i M I I I I I I I I I M II Ml 

541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 
601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I II I I II I II I I I I I I I II I II M M I I I I I I I I I II I I II M I I I I I I II II 

601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

661 G G G C C GAG T G AAG AAT T T T C T GAT G T T C T T T AGT T T C T G CAG GAG G C AAC AG CAC AT G C A 720 

I ' M || | | | M I I II I I I I I I I II II I I I I I II II I I M II II I I I II II I 

661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

721 GT C T AC AT T T GAC AAC AC CAT C AAG GAAC AT T T C AC AGAAGG CT CT AGG C C AGT T T T GT C 78 0 

I I I I I I I I I I II I I I I II II I I I I I I II I I I I M I I I I I I I I II I I I I M I I II I II I II 
721 GT CT AC AT T T GAC AAC AC CAT C AAG GAAC AT T T CAC AGAAGG C T CT AG G C C AGT T T T GT C 7 80 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I N I I I I M M I M I I I I M I II II I I M II I I I I I M I I M I I I I I I I I I I I I I || 
781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I M I M I I M I I I I I I I M I II M II M I M M M I I M M I I I I M I II M I M I M I 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

N I I I I I I M I I I I M M I I I I I I I M I II I II I II II I II I I II II I I I I II II II I II 
9 01 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

961 GAC CTTGGGCTC CAT GGT GAAC AC C T GT C AGAAT C C G GAAAT CT T C AAG GAGAT GAAC AA 102 0 

I I M I I I I M II I II I I II I M I I M I I I M M M I I I M I II M M I I I M I M II II I 



961 GACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGAGATGAACAA 1020 



1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

in91 1JL ' I ' I I I I I I I I ! I I I II I II I I III II II MM mi i || Mil INI I! I 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 
I I I I I I I I I I I I I II I I II I I II I I I I I I I I I I I I I I I I I I || I II I II I I I I I I I I I I I 
AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 



1081 



1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

I I I I I I I I I I I II I I II II I I I I I II I I I I I I | | || || | M I II I II II 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 



1201 
1201 



CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

I I M I I I I I I I I I I I I I I I I I I I I II II || I II II II I I I II I I I I II I II II I I 

CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 



1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 

,„ 1 1 I 'I I N I I I M I I I H I I I I M I I I I I I I I I I I I II I I III I II I I I I I II I I 

1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 



1321 GACATTGGCTCTTAAGATGAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT 1380 
> I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I II I || I I II I I I I I I I I I | | | | 
GACATTGGCTCTTAAGATGAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT 



1321 



1380 



1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | || M II I II M I I I II I II 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I M I I I I I I I I I I I I II I I I I I II I I I II II I I II I I I I I I I II I I | | 

1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 



1501 



1560 



GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 

I 1 I I I M I I I I I I I I I I I I I I I I II M II I I I I I II I I I I I II I I II I I II I I I I I I I II 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I I II II I I I I I I I M I II I I I I I I M II I II I I II M I II II I II II I I II II I II I || 
1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

IN I M I I I I M I I I I I M I I I II I II I I II I I II I | M I I I I I II I I I II I I II 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I I I I I I I I I I I I I I I I II I I I II I M I I I I I I II | | | | || II II I II II II 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I I I I I I I I I I N I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

1 11 I II ' I I I I I I H I I I I II I M I II II I II II I I 

1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 



Qy 


1861 


CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 
M M 1 1 1 1 1 1 1 1 1 1 1 1 1 I U I 1 1 1 1 II 1 1 1 I | | | | | | | | | || || | | | | | | | | | | | 

CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 


1920 


Db 


1861 


192 0 


Qy 


1921 


TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 

1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 
TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 


1980 


Db 


1921 


198 0 


Qy 


1981 


CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 

1 1 1 1 1 1 1 N 1 M 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 


204 0 


Db 


1981 


204 0 


Qy 


2041 


T GC CC CTACTAT CTAT CAT GGAATAACAT C CAAGAAAGACACCTTGCATAT TCTTT CAGT 
' 1 1 N H N 1 II 1 M 1 M 1 1 II 1 M 1 M 1 1 II 1 II 1 I | | | | || | | | | | M M || || | | || 
T GC C C C T AC TAT C TAT CAT GGAATAACAT C C AAGAAAGAC AC C T T G CAT AT TCTTT CAGT 


pi nn 

Z. _L \J U 


Db 


2041 


2100 

£+ -L KJ \J 


Qy 


2101 


TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 

IIIIMMIIIIIIIIIIIIIIIIIIIIIIIIIMIIIIIIIIIMMMIMIIIIMI 

TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 


2160 


Db 


2101 


9 1 fin 


Qy 


2161 


AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 

1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 


999 f) 


Db 


2161 


ZzzU 


Ov 


9991 


L./\Lii (jAbCl CCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 

1 1 M 1 1 1 1 1 1 1 1 1 MINIM II II 1 || | || 1 II 1 II 1 1 1 II 1 II II II 1 

C AGT GAGCT CCTTCTTGGCT GAG CAG G CAT GGAGAC T GTAG GT TT C C AGATT T C CT GAAA 


2280 


Db 


2221 


2280 


Qy 


2281 


AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 

1 M 1 1 1 1 1 1 M II 1 1 1 1 1 II 1 1 II I | | | | | | | | | | | | | || 

AAT AAAAGT T T AC AGC GT TAT CT CT C C C C AAC CT CAC T AA 2320 




Db 


2281 





RESULT 5 
ACH04542 

ID ACH04542 standard; cDNA; 2320 BP. 
XX 

AC ACH04542; 
XX 

DT 01-OCT-2003 (first entry) 
XX 

DE Human cDNA encoding secreted/ transmembrane protein PRO1780 
XX 

KW Human; ss; gene; secreted protein; transmembrane protein; PRO; vulnerary; 

KW cardiant; antidiabetic; anorectic; antiarthritic; angiogenesis ; cancer; 

KW adrenal cortical capillary; endothelial cell growth; wound healing; 

KW stimulated T-lymphocyte proliferation; immune response suppression; 

KW neonatal heart hypertrophy; cardiac insufficiency disorder; 

KW vascular endothelial growth factor; inflammation; mononuclear cell; 

KW eosinophil; diabetes; obesity; or hyper-insulinaemia; hypo-insulinaemia ; 

KW chondrocyte redif f erentiation; bone disorder; cartilage disorder; 

KW sports injury; arthritis. 

XX 

OS Homo sapiens. 
XX 

PN US2003044841-A1. 



XX 

PD 06-MAR-2003. 
XX 



PF 


06 


-DEC 


-2001; 2001US 


-00006856. 


XX 
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PR 
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PR 04-SEP-2001; 2001US-0094 6374 . 
XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Baker KP, Botstein D, Desnoyers 

PI Gao W, Goddard A, Godowski PJ, 

PI Pan J, Paoni NF, Roy MA, Smith 

PI Williams PM, Wood WI ; 



L, Eaton DL, Ferrara N, Fong S; 
Grimaldi JC, Gurney AL, Hillan KJ; 
V, Stewart TA, Tumas D, Watanabe CK; 



XX 

DR WPI; 2003-492259/46. 

DR P-PSDB; AB044514. 
XX 

PT Novel secreted and transmembrane polypeptides and polynucleotides 

PT encoding them useful for treating various cardiac insufficiency 

PT disorders, bone and/or cartilage disorders such as sports injuries and 

PT arthritis. 



Query Match 100.0%; Score 2320; DB 8; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 



Qy 


1 


AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 

1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I | | | | | | | M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 


60 


Db 


1 


60 


Qy 


61 


AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 
1 1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | | | | | | II II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 
AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 


IPO 

J. KJ 


Db 


61 




Qy 


121 


G C T C T C AGAG GC T G C C AAAAT C C T G AC AAT AT CT AC AGT AG GT G GAAG C CAT TAT C T AC T 

1 1 1 M M 1 M M 1 M 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 mi 

GC T C T C AGAG G C T GC CAAAAT CCT GACAAT AT C T ACAGT AG GT G GAAG C CAT TAT CT AC T 


1 RD 

-LOU 


Db 


121 


180 


Qy 


181 


GAT G G AC CGGGTTTCT C AG AT T C T T C AAG AT C AC G GT CAT AAT GT C AC CAT G C T T AAC C A 

1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 I I I M I M M | 

GAT GGAC CGGGTTTCT C AGAT T C TT CAAGAT C AC GGT CAT AAT GT C AC CAT G C T TAAC C A 


240 


Db 


181 


24 0 


Qy 


241 


CAAAAGAGGT CCTTTTATGCCAGATTTTAAAAAGGAAGAAAAAT CATATCAAGTTAT CAG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | | | || | | | | | | | | M 1 1 1 1 1 | | | | | | | | | | | | | | 

CAAAAGAGGT CCTTTTATGCCAGATTT TAAAAAGGAAGAAAAAT CAT AT CAAGTTAT CAG 


300 


Db 


241 


300 


Qy 


301 


TTGGCTTG C AC C T GAAG AT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I | | | | | | | M 1 1 1 1 
TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 


360 


Db 


301 


360 


Ov 


361 


twotwi^i. i i/voi^i kj/\AAA X l J. bAAAACTTATTAAATGTTCTAGAATACTTGGC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 | | | | | | | | | || | | | | | | | | | | | | | | 

AGAAAC T T TAG GT GGC AGAGGAAAAT T T GAAAAC T TAT T AAAT GT T C T AGAAT AC TT G GC 


420 


Db 


361 


420 


Qy 


421 


GTT GCAGTGCAGTCATTTTTTAAATAGAAAGGATAT CATGGATT CCTTAAAGAATGAGAA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I | I | | | || || | | | | || | | | | 

GT T G C AGT G CAGT CAT T T T T T AAAT AGAAAG GAT AT CAT GGAT T C C T T AAAGAAT G AGAA 


480 


Db 


421 


480 


Qy 


481 


CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 

1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 

CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 


540 


Db 


481 


540 


Qy 


541 


TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 

TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 


600 


Db 


541 


600 


Qy 


601 


AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 

1 1 1 M 1 II II 1 1 1 I I I 1 I M 1 II 1 I | | || | || | | | | | | | | | | | | | | || 

AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 


660 


Db 


601 


660 



661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

I I I M I I I I I I I II I I I I I I I I I I I I I I II I I II | I | | | M II I I II I I I I I I I 

661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

721 GTCTACATTTGACAACACCATCAAGGAACATTTCACAGAAGGCTCTAGGCCAGTTTTGTC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | 1 I I I ! I I I I t I I 

721 GTCTACATTTGACAACACCATCAAGGAACATTTCACAGAAGGCTCTAGGCCAGTTTTGTC 7 8 0 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

I I I I I I I I I I I I I I I I I I I Ill I I I I I I I I I I I I I I I I I I I I II I I I II 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAA.ee 90 0 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I | | | I I I I I I I I I I I I I I I I | | | I 
901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

961 GACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGAGATGAACAA 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 GACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGAGATGAACAA 1020 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | I | | | 
1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I || 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 132 0 

I HI I I I I I I I I I I I M I I I I I I I I II I I I I I I I I II I I I I I I I I 

1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 

1321 GAC ATT GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGTC C GCGGCAGT 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
1321 GACATT GGCT CTTAAGAT GAAACAAAT CATGGAAGACAAGAGATACAAGT CCGCGGCAGT 1380 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I II I I I 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I N I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 



1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 15 60 
1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

I I I N I I I I I I I I I M I I I I I I I | | | | | | | | | | M | I I I I I I I I I I | | | | | | | | | | | | | | 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

' I I M I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I | | | | | 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

' ' N I I I I I | | | If I I I I I I I I I | I | I | | [ | I I I I I I i I I I I I I | | | | | | | | | | I | | | | | 
1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

N M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M | I I II I I I I I II I I I I I I 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 
1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I M I I I II I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

I I I I I I I I I I I I I M I I I I I I I I I | | | | | | | | | | | | | | | | | || | | | | | | | 

1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

Mllllll MINIMI I M M I II I II M I M II M I I I M I I M I I I II II I 

1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 
1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2040 

I I I I II II I I M II II II I I I II I I I I I I I I I II I II I II II II I I II II I I || || | || | 

1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 
2 041 T G C C C CT AC TAT CT AT CAT G GAAT AAC AT C C AAGAAAGACAC C T T G CAT AT T CT T T C AGT 2100 

I I I I M II I II I I II I II I I I I II I I I I I I I II M II II II II II | | | | | 

2041 T G C C C C T AC TAT C TAT CAT G GAAT AAC AT C C AAGAAAGACAC C T T G CAT AT T C T T T C AGT 2100 

2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I M I I M I I II I I M I II I II I I I II III I I I I | | M II II I I I II I I I M I 
2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

MM I M M I I I I II 1 I II I II I I I I | | || | || | || | | | | || || || | || | | || || 

2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

2221 CAGT GAGCTC CT TCTT GGCT GAGCAGGCATGGAGACT GTAGGTTT C CAGAT T T C CT GAAA 22 8 0 

NM I I I I I II I I II I I I I I I I II II I M I I I I I I I I I I || I | | || | | | | M II I 

2221 C AG T GAG CTCCTTCTTGGCT GAG C AG G CAT G GAG AC T G T AG G T T T C CAGAT T T C C T GAAA 2280 

22 81 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 

I N M M II I M II II II I I I I I I M I II II I II II II I I 
22 81 AAT AAAAGT T T AC AG C GT TAT C T C T C C C C AAC C T C AC T AA 2320 
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PT Novel isolated PRO polypeptides e.g. PR01491 and PR01571, useful in the 

PT preparation of a medicament for treating a condition responsive to PRO 

PT polypeptide, and as therapeutic agents e.g. vaccines. 
XX 

PS Claim 2; Fig 159; 561pp; English. 
XX 

CC The invention describes an isolated PRO (secreted and transmembrane) 

CC polypeptide (I), having at least 80% sequence identity to a sequence 

Query Match 100.0%; Score 2320; DB 8; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0 
Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I N M I I I I I I I I I I I I I I | | | | | | | | | | | | | | m I I I I I I I I I I I I I I I | | | | | | 

Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

QY 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | M M I I M I I I I I I I 

Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

QY 121 G C T C T C AGAG G CT G C CAAAAT C C T GAC AAT AT C T AC AG TAG GT GGAAGC C AT TAT C T AC T 18 0 

I I I I I I I I I I I M I I I I I I I I I I I || | | | | | | | | || | | || | | | | | || | | || | || | | | | | | 
Db 121 G C T C T C AGAGG C T G C CAAAAT C C T GAC AAT AT C T AC AG T AG GT G GAAG C CAT TAT C T AC T 18 0 

Qy 181 GAT G GAC CGGGTTTCT C AG AT T C T T C AAG AT C AC G GT CAT AAT GT C AC CAT G C T T AAC C A 24 0 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I II I II II I I I 

Db 181 GAT G GAC CGGGTTTCT C AG AT T C T T C AAG AT C AC G G T CAT AAT G T C AC CAT G C T T AAC C A 24 0 

Qy 241 C AAAAGAG GT C C T T T TAT G C C AGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 300 

I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I t I I I I I I I I I II I I I I I I I I | 

Db 241 C AAAAGAG GT C CT T T TAT G C C AG AT T T T AAAAAG GAAGAAAAAT CAT AT C AAG T TAT C AG 300 

Qy 301 TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 
MM I I I I I I I I I I I I I I I I | M I I I || I I I II I I I II I I I I I 



Db 301 TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 

Qy 361 AGAAACTTTAGGTGGCAGAGGAAAATTT GAAAACTTATTAAATGTT CTAGAATACTT GGC 42 0 

I I I I I I M I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I | M I I 

Db 361 AGAAACTTTAGGT GGCAGAGGAAAATTT GAAAACTTATTAAATGTT CTAGAATACTT GGC 42 0 

QY 421 GT T G C AGT GC AGT CAT T TT T T AAAT AGAAAGGAT AT CAT G GAT T C CT T AAAGAAT GAGAA 48 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GTT GCAGT GCAGT CATT TT TT AAAT AGAAAGGAT AT CAT GGATT CCTT AAAGAAT GAGAA 480 

Qy 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I I I I M I I I I I I I I I II I I I I I II II I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I 
Db 4 81 CT TC GACAT GGT GATAGTT GAAACT TTT GACTACT GT C CT TT CCT GATTGCT GAGAAGCT 54 0 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I | | | || 
Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I 
Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 GG GC C GAGT GAAGAAT T T T CT GATGT T CT TT AGT T T CT GC AG GAGG CAAC AGCAC AT GC A 720 

Qy 721 GT CT AC AT T T GACAAC AC CAT CAAG GAACAT T T C ACAGAAGGC T C T AGGC C AGT TT T GT C 780 

M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 721 GT CT AC AT T T GACAACAC CAT CAAG GAACAT T T C ACAGAAG G C T CT AG GC C AGT TT T GT C 780 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I II I I I I I | I I | | 
Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 9 60 

Qy 961 GAC CT T GG GCT C CAT GGT GAAC ACC T GT C AGAAT C C G GAAAT C T T C AAGGAGAT GAAC AA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I I I | 
Db 961 GAC CTTGGGCTC CAT GGT GAAC AC C T G T C AG AAT C C G GAAAT C T T CAAG GAG AT G AAC AA 1020 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

Qy 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I 
Db 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

Qy 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 



Qy 12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT .12 60 

Qy 1261 G GT C C GAGT AG AAG C C AAAAAGT TTGGTGTTTC TAT T C AGT T AAAGAAG C T C AAG G C AG A 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 132 0 

Qy 1321 GACATTGGCT CTTAAGAT GAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT 1380 

I I I II II I I I M I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1321 GAC AT T G G CT CT T AAG AT GAAACAAAT CAT G GAAGACAAGAGAT AC AAGT C C GC G G C AGT 138 0 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I II II I I II I I I I I I I I II I I I I I I I 
Db 13 81 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

Qy 1441 GATT GACCAC GT C CT C CAGACAGGGGGC GC GAC GCACCT CAAGC CCT AT GT CT T T CAGCA 150 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I 
Db 1441 GAT T GAC CAC GT C CT C C AGAC AG GG G GC GC GAC GC AC CT C AAGC C CT AT GT CT T T CAGCA 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I 
Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 1 I I II I I I II II I I I I I 
Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 T GGAC CACT GAC C CT CAGAT T T C CAGC CT T AAAAT C CAC CTT CCTT CT CAT GC GCCT CT C 1980 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 204 0 



Qy 2041 T GCC C CT ACT AT C TAT CAT GGAAT AAC AT C C AAGAAAGACAC CT T G CAT AT T C T T T C AGT 2100 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I I I I I 
Db 2041 T G C C C C T AC TAT CT AT CAT G GAAT AAC AT C CAAGAAAGACAC CT T GC AT AT T CT T T C AGT 2100 



Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 

Qy 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22 81 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 
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XX 
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XX 
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XX 
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XX 

OS Homo sapiens. 
XX 

PN US2003064925-A1. 
XX 

PD 03-APR-2003. 
XX 

PF 10-DEC-2001; 2001US-00013907 . 
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DR WPI; 2003-555602/52. 

DR P-PSDB; ADC18151. 
XX 

PT Novel isolated PRO polypeptides e.g. PR01491 and PR01571, useful in the 

PT preparation of a medicament for treating a condition responsive to PRO 

PT polypeptide, and as therapeutic agents e.g. vaccines. 
XX 

PS Claim 2; SEQ ID NO 281; 555pp; English. 
XX 

CC The invention relates to human PRO polypeptides and the polynucleotides 

CC encoding them. The sequences are useful in the preparation of a 

CC medicament for treating a condition responsive to a PRO polypeptide. The 

CC polypeptides are useful in a number of functional biological assays, as 

CC molecular weight markers for protein electrophoresis and as therapeutic 
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XX 



1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I ! II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I M I I 
1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I II I I I I I I I I I I 
61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

121 GC T C T C AGAG G CT G C CAAAAT C CT GAC AAT AT C T ACAGT AGGT G GAAG C CAT T AT CT AC T 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 GCTCTCAGAGGCTGCCAAAATCCTGACAATATCTACAGTAGGTGGAAGCCATTATCTACT 18 0 

181 GAT G GAC CGGGTTTCT C AGAT T CT T CAAG AT CAC G GT CAT AAT GT C AC CAT G CT T AAC C A 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
181 GAT G GAC C GGGT T T CT C AGAT T CT T CAAGAT CAC G GT CAT AAT GT CAC CAT G CT TAAC C A 240 

241 C AAAAG AG GT C C T T T TAT G C C AG AT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 CAAAAGAGGT C CT T T TAT G C C AGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 3 00 

301 T T GG CT T GCAC C T GAAGAT CAT CAAAGAGAATT T AAAAAG AGT T T T GAT TTCTTTCT GGA 360 

I I I I I I I I I II I I I I I I I I I i I E I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M 

301 T T GG CT T GC AC CT GAAGAT CAT CAAAGAGAATT T AAAAAG AGT T T T GAT TTCTTTCTG GA 360 

361 AGAAACTTTAGGTGGCAGAGGAAAATTTGAAAACTTATTAAATGTTCTAGAATACTTGGC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
361 AGAAACTT T AGGT G GC AGAG GAAAATT T GAAAACT TAT T AAAT GT T CT AGAAT ACT T G GC 420 

421 GT T G C AGT G C AGT CAT T T T T T AAAT AG AAAGGAT AT CAT G GAT T C C T T AAAGAAT G AGAA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
421 GT T G C AGT G C AGT CAT T T T T T AAAT AGAAAGGAT AT CAT G GAT T CCT T AAAGAAT GAGAA 4 80 

481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 81 CT T C GAC AT G GT GAT AGT T GAAAC T T T T GAC TACT GTCCTTTCCT GAT T G CT GAGAAG C T 54 0 

541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

721 GT CT AC AT T T GACAAC ACC AT CAAGGAAC AT T T CACAGAAGG CT CT AG GC C AGT TT T GT C 7 80 

I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 GT CT AC AT T T GAC AAC AC CAT CAAGGAAC AT T T C AC AGAAG G CT C TAG G C C AGT T T T GT C 7 80 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



l l 1 1 M 1 1 1 1 1 1 1 1 I 1 1 1 1 l I 1 1 l l 1 1 l 1 1 l I l l 1 1 1 1 1 1 1 I I 1 1 1 1 I l I l 1 1 l I 1 1 I I I 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 9 00 

901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I 
9 01 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

9 61 G AC CTTGGGCTC CAT G GT G AACAC CT GT C AGAAT C C GG AAAT C T T C AAG GAG AT GAAC AA 102 0 

I I I I I I I I I I I I I I I I I I I I I i I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
961 GACCTT GGGCT C CAT GGT GAACAC CT GT CAGAAT C C GGAAAT CT T CAAGGAGAT GAACAA 1020 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I II I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I 
1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 G G C T C AC C C AAG CAT CCGTCTGTTTGT C AC C C AC G G C G G G CAGAAT AG C AT AAT G GAG G C 1200 

1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

12 61 G GT C C GAGT AGAAG C C AAAAAGT TTGGTGTTT CT AT T C AGT T AAAGAAG C T C AAG GC AGA 132 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I II I I I I I I 
12 61 G GT C C GAGT AGAAG C CAAAAAGT TTGGTGTTT CT AT T C AGT TAAAGAAG C T C AAGGC AGA 132 0 

1321 GACATT GGCT CT TAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGT CCGCGGCAGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I II I I 
1321 GACATT GGCT CT TAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGT C CGCGGCAGT 1380 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 15 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 



Db 



1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 



Qy 17 41 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 180 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 17 41 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I 
Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

Qy 2 041 TGCCCCTACTAT CTATCATGGAATAACAT CCAAGAAAGACACCTTGCATATT CTTTCAGT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I 11 I I I I I I I 1 
Db 2 041 T GCCCCTACT AT CTAT CAT GGAATAACAT CCAAGAAA.GACAC CT T GCATATT CTTT CAGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 80 

I II I I I I I II I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2221 CAGT GAGCT CCTTCTTGGCT GAG CAGGC AT GGAGACT GT AGGT T T C C AGAT T T C CT GAAA 22 8 0 

Qy 2281 AAT AAAAGT T TACAGC GT TAT C T CT C C C CAAC C T CACT AA 2320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22 81 AAT AAAAGT T TACAGC GT TAT C T CT C C C CAAC C T C AC T AA 232 0 



RESULT 8 
ADD70796 

ID ADD70796 standard; cDNA; 2320 BP. 
XX 

AC ADD70796; 
XX 

DT 15-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/transmembrane protein PRO1780. 
XX 
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XX 
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XX 
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XX 
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PA (GETH ) GENENTECH INC. 
XX 

PI Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 

PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 

PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 

PI Williams PM, Wood WI; 
XX 

DR WPI; 2003-874602/81. 

DR P-PSDB; ADD70797. 
XX 

PT Novel isolated PRO polypeptides e.g., PRO1130, PR01275, PR01418, PR01555, 

PT PR01787 affect glucose or free fatty acid (FFA) uptake by skeletal muscle 

PT cells and are useful for treating diabetes or hyper- or hypo-insulinemia . 
XX 

PS Claim 2; SEQ ID NO 281; 553pp; English. 
XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

Query Match 100.0%; Score 2320; DB 9; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 232 0; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I 
Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

Qy 121 GCTCT CAGAGGCTGCCAAAAT CCTGACAATATCTACAGTAGGTGGAAGCCATTAT CTACT 18 0 

I I I I I I I I I II I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I II I II I I I I I I 
Db 121 GCTCT CAGAGGCT G CC AAAAT CC T G ACAAT AT CT AC AGT AGGT G GAAGCC AT TAT C TACT 180 

Qy 181 GAT G GAC CGGGTTTCT C AGAT T C T T CAAG AT C AC G GT C AT AAT GT C AC CAT GC T TAAC C A 24 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I 
Db 181 GAT G GAC CG G GT T T CT CAGAT T C TT CAAGAT C AC GGT CAT AAT GT C AC CAT GCT T AAC C A 24 0 

Qy 241 C AAAAGAGG T C C T T T TAT GC CAGAT T T T AAAAAG G AAGAAAAAT CAT AT C AAGT TAT C AG 30 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 241 CAAAAGAGGT C CT T TT AT GC CAGAT TT TAAAAAGGAAGAAAAAT CAT AT CAAGT TAT CAG 300 

Qy 301 TTGGCTTG C AC CT GAAG AT CAT C AAAG AG AAT T T AAAAAGAGT T T T GAT TTCTTTCT GG A 360 

I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T T G G CT T GCAC CT GAAG AT CAT CAAAG AGAAT T T AAAAAGAGT TT T GAT TTCTTTCT GGA 360 

Qy 361 AGAAAC T T T AG GT GG C AG AGGAAAAT T T GAAAACT T AT T AAAT GT T C TAG AAT AC T T GG C 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I I I I I I I 
Db 361 AGAAACTTT AGGT GGCAGAGGAAAATTTGAAAACTTATTAAATGTTCT AGAAT ACTTGGC 42 0 

Qy 421 GT T G CAG T G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT G AG AA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I 
Db 421 GTT GCAGT GCAGT CAT TTTT TAAAT AGAAAGGAT AT CAT GGATTC CTT AAAGAAT GAGAA 4 80 



Qy 

Db 



481 C T T C GAC AT G GT GAT AGT T GAAACT T T T G ACT ACT GT CCTTTCCT GAT T G CT GAGAAGCT 540 

I I I II I II I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I 
4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 



Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

M | | I I I I I I I I I I I II I I I I I I I I I I I I I ! II I I I I I I I I I I I I I I I I I M I M.I I I I I 

Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

Qy 601 AAT C CCCTT GT CT TATGTT CCAGTATT CC GTT C CT T GCT GACTGAT CACAT GGACTT CT G 660 

II I I I I I I I I I I M I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 GGGCCGAGT GAAGAATTTT CT GAT GTT CTT T AGT T T CT GCAGGAGGCAACAGCACAT GCA 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 GGGC C GAGT GAAGAATT T T C T GAT GT T CT T T AGT T T CT G C AG GAG GCAAC AG CACAT GCA 72 0 

Qy 721 GT CTACATTT GACAACACCAT CAAGGAACATT T CACAGAAGGCT CT AGGCCAGTTTTGT C 780 

I I I I I I I II II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 

Db 721 GT C T AC AT T T G ACAACAC CAT CAAG GAACAT T T CACAGAAGGCT CT AG GC C AGT T T T GT C 78 0 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 7 81 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 841 T C GAC CTCTGCTTCC CAAC ACT GT T TAT GT T G GAGG CT T GAT GGAAAAACC T AT T AAAC C 900 

Qy 901 AGT AC C AC AAGAC T T GGAGAACT T CAT T GC C AAGT T T GGG GACT CTGGTTTTGTCCTTGT 9 60 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 AGT AC CACAAGACTT GGAGAACT T CAT T G C CAAGTT T GGG GACT CT G GT T T T GT C CT T GT 960 

Qy 961 GACCTT GGGCT CCAT GGT GAACACCT GT CAGAAT CCGGAAAT CTT CAAGGAGAT GAACAA 1020 

I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I 

Db 961 GACCT T GGGCT CCAT GGT GAACAC CT GT CAGAAT CCGGAAAT CTT CAAGGAGAT GAACAA 1020 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 10 80 

Qy 1081 AGAT GT CCAC CT G GCT G CAAAT GT GAAAAT T GT GGACT GG CT T C CT C AGAGT GAC C T C C T 114 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1081 AGAT GT C CAC CT GGCT G CAAAT GT GAAAAT TGTG GACT GG CT T C CT C AGAGT GAC CTCCT 1140 

Qy 1141 GGCT CAC C CAAG CAT CCGTCTGTTTGT CAC C CAC GGC GGG CAGAAT AG CAT AAT G GAGG C 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 GGCT CAC CCAAGCAT CCGTCTGTTTGT CAC C CAC GGCGGGCAGAAT AGCAT AAT GGAGGC 1200 

Qy 12 01 CAT CCAGCAT GGT GT GC CCAT GGTGGGGAT CC CT CT CT TT GGAGACCAGC CT GAAAACAT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 01 CAT C C AGCAT GGT GT GC C CAT GGT GGGG AT CCCTCTCTTT GGAGAC C AG C C T GAAAACAT 12 60 

Qy 12 61 GGT C C GAGT AGAAGC CAAAAAGT TT GGT GT T T CT AT T CAGTT AAAGAAGCT CAAGGCAGA 1320 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 12 61 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 

Qy 1321 GAC AT T GG C T CT T AAGAT GAAACAAAT CAT GGAAGACAAG AGAT ACAAGT C C G C G G C AGT 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I 

Db 1321 GAC AT T G G CT C T T AAGAT GAAACAAAT CAT GGAAGACAAG AGAT AC AAGT C C GC G G C AGT 1380 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 40 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 15 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I 
1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I II I I I I I 
1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I 
1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 4 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 4 0 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I I I I I 

1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

1921 T G GACCACT GAC CCT C AGAT T T C C AGC CT T AAAAT C C AC CTTCCTTCT CAT GCGCCTCTC 198 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

1981 C GAAT C AC AC C CT GACT CT T C C AG C CT C CAT GT C C AGAC C T AGT C AGC C T CT CT C AC T C C 2 040 

I II I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I II I I I I I I 

1981 C GAAT CACAC C CT GACT CTT CC AGC CT C CAT GT C CAGACCTAGT CAGC CT CT CT C ACT C C 2 040 

2041 T GCC C CTACT AT CT AT CAT GGAAT AACAT C C AAGAAAGAC AC CTT GCAT AT T CT TT CAGT 210 0 

I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 T GCC C CTACT AT CT AT CAT GGAAT AACAT C CAAGAAAGACAC CTT GCAT AT T CT T T CAGT 210 0 

2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I II I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

2221 CAGT GAGCT CCTTCTTGGCT GAG CAGG CAT GGAGACT GT AG GT TT C C AGAT T T C CT GAAA 228 0 



Db 2221 CAGT GAGCT CCTTCTTG G CT G AG CAG GCAT GGAGACT GT AGGT T T C C AGAT T T C CT GAAA 2280 

Qy 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 

I I I I I I I I I I I I I I I M I I I I I I I I M II I I I I I I I I I I I 
Db 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 
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Human cDNA encoding secreted/transmembrane protein PRO17 80. 
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PR 01-JUN-2001; 2001WO-US017800 . 

PR 20-JUN-2001; 2001WO-US019692 . 

PR 29-JUN-2001; 2001WO-US021066 . 

PR 09-JUL-2001; 2 001WO-US02 1735 . 

PR 04-SEP-2001; 2 0 01US-0094 6374 . 
XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 

PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 

PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 

PI Williams PM, Wood WI; 
XX 

DR WPI; 2003-755122/71. 

DR P-PSDB; ADD39874. 
XX 

PT New secreted and transmembrane PRO polypeptides useful for treating 

PT cancers, kidney disorders, Crohn's disease, diabetes mellitus, hyper- or 

PT hypo-insulinemia, sports injuries and arthritis. 

XX 

PS Claim 2; SEQ ID NO 281; 557pp; English. 
XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

CC transmembrane protein) having at least 80% amino acid sequence identity 

CC to an amino acid sequence chosen from 123 fully defined sequences as 

CC given in the specification (including their extracellular domains either 

CC or without their associated signal peptides. Also include are the 

CC nucleotide (NA) sequences encoding PRO, a vector comprising the PRO NA, a 

CC host cell comprising the vector, producing PRO, a chimaeric molecule 

CC comprising PRO fused to a heterologous amino acid sequence, and an anti- 

CC PRO antibody. Pro is useful as molecular weight markers for protein 

CC electrophoresis and also for chromosome identification. PRO is also 

CC useful for tissue typing. PRO and PRO NA are useful as hybridisation 

CC probes for a cDNA library to isolate the full-length PRO cDNA. PRO NA is 

CC useful for generating transgenic animals or knock-out animals which are 

CC useful in development and screening useful reagents. PRO NA is also 

CC useful in gene therapy. PR01244, PR01286 and PRO1303 polypeptides are 

CC useful for treating cancerous tumours. PRO1250, PR01418 and PRO1410 

CC polypeptides are useful for suppressing immune response. PR01246 

CC polypeptide is useful for treating cardiac insufficiency disorders. 

CC PR01246 polypeptide is also useful for treating tumours. PR01246 and 

CC PR01561 polypeptide are useful for stimulating calcium flux in human 

CC umbilical vein endothelial cells. PR01265, PRO1250 and PR01474 

CC polypeptides are useful for treating bone and/or cartilage disorders 

CC (e.g., arthritis) and wound healing. PRO1130, PR01275 and PR01418 

CC polypeptides are useful for treating diabetes in skeletal muscle cells 

CC and obesity. PR01265, PR01244 and PR01382 polypeptides are useful for 

CC treating Berger disease or other nephropathies associated with Schonlein- 

CC Henoch purpura, coeliac disease, dermatitis, herpetiformis or Crohn's 

CC disease. PR01478, PR01265, PR01412, PR01279, PRO1304, PRO1306, PR01418, 

CC PRO1410 and PR01575 are useful in treating thalassaemias . The present 

CC sequence encodes a PRO protein of the invention. 

XX 

SQ Sequence 2320 BP; 545 A; 581 C; 538 G; 656 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2320; DB 9; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 



Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I | I I I 

Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

Qy 121 GCT CT C AGAG G C T GC CAAAAT C C T GAC AAT AT CT ACAGT AG GT GGAAG CC AT T AT CT ACT 180 

II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 121 GC T CT C AGAGG CT GC CAAAAT C CT GACAAT AT C T AC AGT AG GT G GAAG C CAT TAT C T AC T 18 0 

Qy 181 GAT G GAC CGGGTTTCT C AG AT T CT T C AAGAT C AC G GT CAT AAT GT C AC CAT GCT TAAC C A 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GAT GGAC CGGGTTTCT C AGAT T C TT CAAGAT C AC GGT CAT AAT GT C AC CAT GCT TAAC C A 24 0 

Qy 241 C AAAAG AG GT C CT T T TAT G C C AGAT T T T AAAAAG G AAGAAAAAT CAT AT C AAGT TAT C AG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 241 C AAAAGAG GT C C T T T TAT G C C AG AT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 300 

Qy 301 TTGGCTTG C AC CT GAAGAT CAT CAAAGAGAAT T T AAAAAG AGTT TT GATT T C T T T C T GGA 360 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 301 TTGGCTTG C AC C T GAAGAT CAT CAAAGAGAAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 3 60 

Qy 361 AGAAACT T T AG GT GGC AGAGGAAAAT T T GAAAACT T AT TAAAT GT T CT AGAAT ACT T G G C 42 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 361 AGAAACT T T AGGT G G CAGAGGAAAAT T T GAAAAC T TAT TAAAT GTT CT AGAAT AC T T G G C 42 0 

Qy 421 GT T G C AGT G C AGT CAT T T T T TAAAT AGAAAG GAT AT CAT G GAT T C C T T AAAG AAT GAGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 421 GT T GCAGT GCAGT CATTTTTTAAAT AGAAAG GAT AT CAT GGATT CCTTAAAGAAT GAGAA 4 80 

Qy 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 540 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I | | | | | | | | I | I I 

Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

I I I I I I I II I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

Qy 721 GT C T AC AT T T GAC AAC AC CAT CAAG GAAC AT T T C AC AG AAGG C T CT AG G C C AGT T T T GT C 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GTCTACATTTGACAACACCATCAAGGAACATTTCACAGAAGGCTCTAGGCCAGTTTTGTC 7 80 

Qy 7 81 TCATCTTCTACTGATVAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 



Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I 
Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 9 00 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 9 60 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

Qy 961 GAC CTTGGGCTC CAT GGT GAACAC CT GT C AGAAT C C G GAAAT C T T C AAGG AGAT G AAC AA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I 
Db 961 GAC CTTGGGCTC CAT GGT GAACAC C T GT C AGAAT C C G GAAAT CT T C AAGGAGAT GAAC AA 102 0 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I i I I I I I I I I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

Qy 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I 
Db 1081 AGAT GT C CAC CT G GCT G C AAAT GT GAAAAT T GT GGACT GG CT T C CT CAGAGT GAC CT C C T 114 0 

Qy 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1141 G G C T CAC C C AAG CAT CCGTCTGTTTGT CAC C CAC G G C G G G C AG AAT AG C AT AAT G GAG G C 1200 

Qy 1201 CAT C C AG CAT GGTGTGCC CAT G GT G G G GAT CCCTCTCTTTG GAG AC C AG C C T G AAAAC AT 1260 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 CAT C CAG CAT GGT GT GC C CAT GGT GGGGAT C C CT CT CT T T GGAGAC C AG C CT GAAAAC AT 1260 

Qy 1261 G GT C C GAGT AGAAG C CAAAAAGT T T G GT GT T T C TAT T C AGT T AAAGAAGC T C AAG GC AGA 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I 
Db 1261 GGT C C GAGT AGAAG C CAAAAAGT T T G GT GT T T CT AT T CAGTTAAAGAAGCT CAAG GC AGA 1320 

Qy 1321 GACATTGGCTCTTAAGATGAAACAAAT CAT GGAAGACAAGAGATACAAGTCCGCGGCAGT 1380 

I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 GAC AT T GG CT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT C C GC GGC AGT 1380 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I 
Db 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II II I 
Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 



Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I 

Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I 
Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

Qy 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAA7\ATCCACCTTCCTTCTCATGCGCCTCTC 1980 

I I I I I II I I I I II I I I I I I II I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I M I I I 

Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

Qy 1981 C GAAT CACACC CT GACT C T T C CAGC C T C CAT GT C CAGAC CTAGT C AGCC T CT CT CAC T C C 2 04 0 

I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 C GAAT CACAC CCT GACT CTTCCAGCCTC CAT GTCCAGAC CTAGT CAGC CTCTCTC ACT CC 2040 

Qy 2041 T GC C C C TACT AT CT AT CAT G GAAT AAC AT C C AAG AAAGAC AC C T T G CAT AT T CT T T C AGT 2100 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2041 T G C C C CT AC TAT CT AT CAT G GAAT AAC AT C C AAGAAAGACAC CT T GC AT AT T CT T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I II I I I I I I I I I I I I I I I I I 
Db 2221 CAGT GAGCT CC TT C T T GG CT GAG C AG GC AT GGAGAC T GT AGGT T T C CAGAT T T C C T GAAA 2280 

Qy 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 

I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 



RESULT 10 
ADD70319 

ID ADD70319 standard; cDNA; 2320 BP. 
XX 

AC ADD7 0319; 
XX 

DT 15-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/transmembrane protein PRO1780. 
XX 

KW Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 
KW immune response; cardiac insufficiency disorder; calcium flux; 



KW umbilical vein endothelial cell; bone disorder; cartilage disorder; 

KW arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 

KW Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease; 

KW dermatitis; herpetiformis; Crohn's disease; thalassaemia . 

XX 

OS Homo sapiens. 
XX 

PN US2003054406-A1. 
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PR 04-SEP-2001; 2001US-00946374 . 
XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 

PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL , Hillan KJ; 

PI. Pan J , Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 

PI Williams PM, Wood WI; 
XX 

DR WPI; 2003-708344/67. 

DR P-PSDB; ADD70320. 
XX 

PT Novel isolated PRO polypeptide useful for tissue typing, modulating 

PT biological activity of cell, as molecular weight markers in protein 

PT electrophoresis, for treating arthritis, tumor. 
XX 

PS Claim 2; SEQ ID NO 281; 549pp; English. 
XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

Query Match 100.0%; Score 2320; DB 9; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 
Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ll 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 

Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

M I I I I I I I I I II I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 

Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

Qy 121 GC T C T CAGAGGCT GC CAAAAT CC T GAC AAT AT CT AC AGT AGGT GGAAGC C AT TAT C TACT 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 121 G CT CT CAGAGG C T GC CAAAAT C CT GAC AAT AT C TAC AGT AGGT GGAAG C CAT TAT CT ACT 18 0 

Qy 181 GAT G GAC CGGGTTTCT C AG AT T C T T C AAG AT C AC G GT CAT AAT GT C AC CAT G C T T AAC C A 240 

M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 181 GAT GGAC CGGGTTTCT C AGAT T C T T CAAGAT C AC GGT CAT AAT GT C AC CAT G C T TAAC C A 24 0 

Qy 241 C AAAAGAG GT C CT T T TAT G C C AGAT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT C AG 300 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 C AAAAGAGGT C C T T T TAT G C C AGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 300 

Qy 301 TTGGCTTG CAC CT GAAGAT CAT CAAAGAGAAT T T AAAAAGAGT T T T GAT TTCTTTCTG G A 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 TTGGCTTG CAC C T GAAGAT CAT CAAAGAGAAT T T AAAAAG AG T T T T GAT TTCTTTCTG G A 360 

Qy 3 61 AGAAACT TT AGGT GG C AGAGGAAAAT T T GAAAACT T AT T AAAT GT T CT AGAAT AC T T GG C 42 0 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AGAAAC T T TAG GT G G C AG AG GAAAAT T T G AAAAC T TAT T AAAT G T T C T AGAAT AC T T G G C 42 0 

Qy 421 GT T G C AGT G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAG AAT GAGAA 480 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 421 GT T G CAGT G C AGT CAT T T T T T AAAT AGAAAG GAT AT C AT GGAT T C C T T AAAGAAT GAGAA 4 80 



Qy 



481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 



Db 

Qy 

Db 
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541 



I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I | | | | I I I I I I | | | I I 
CT T C GAC AT GGT GAT AGT T GAAACT T T T GAC TACT GT CCTTTCCT GAT T G CT GAGAAGCT 



TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 

I I I I I I I I I I I II I I I I I I I I I I II I I II I I I I I II I I I I I I I II II I I I I I I I I I I I I I 
541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 
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661 



661 



721 



721 



781 



AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 
I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I | | | | | I I I I I | | | | | 
AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 

GGGC C GAGT GAAGAAT T T T C T GAT GT T CT T T AGT T T C T GCAG GAGGC AAC AG C ACAT GC A 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I 
GG G C C GAGT GAAGAAT T T T CT GAT GT T CT T T AGT T T C T GC AG GAGG C AAC AG C ACAT GC A 

GTCTACATTT GACAACAC CAT CAAGGAACATT T CACAGAAGGCT CTAGGCCAGTTTT GT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I II I I I | I | I 
GT C T AC AT T T GACAACAC CAT C AAG GAAC AT T T C AC AGAAG G C T CT AG G C C AGT T T T GT C 



TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 
I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 
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TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 
I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 1 I I I I I I I II I I I I I 
TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 



AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

901 AGT AC CAC AAGACT T GGAGAACT T CAT T G C CAAGT T T G GG GAC TCTGGTTTTGTCCTTGT 
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961 GAC CT T G GG C T C CAT GGT GAAC AC C T GT C AGAAT C C G GAAAT CT T CAAGGAGAT GAACAA 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAC CT T GG GCT C CAT GGT GAACACC T GT CAGAAT C CG GAAAT C T T CAAGGAGAT GAACAA 1020 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I II I I II I I I I I I I I I 
1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

1081 AGAT GT C C AC CT GG C T G C AAAT GT GAAAAT T GT GGACT GGCT T C CT CAGAGT GAC CT CC T 1140 

I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1141 GGCT CAC C CAAGCAT C C GT CT GT TT GT CAC C CAC G GC GGG CAGAAT AG C AT AAT GGAG G C 12 0 0 

1201 CAT C CAGCAT GGT GT GC C CAT GGT GGGGAT CC CT CT CT TT GGAGAC C AGC CT GAAAAC AT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

12 61 G GT C C GAGT AGAAG C C AAAAAGT TTGGTGTTT CT AT T C AGT T AAAGAAG C T C AAG G C AGA 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12 61 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 132 0 

1321 GAC AT T G G CT CT TAAGAT G AAAC AAAT CAT GGAAG AC AAGAG AT AC AAGT C C G C GG C AGT 138 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 



Db 1321 GAC AT T GG CT CT T AAGAT GAAACAAAT CAT GGAAGACAAGAGAT AC AAGT CCGCGG C AGT 138 0 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 40 

I I I M I I II I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I I II 
Db 1441 GAT T GAC C AC GT C C T C C AG AC AG GGGGCGC GAC G C AC C T C AAG C C C TAT GT C T T T C AG C A 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II M II I 

Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

II I I I I I II I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1621 AAAGGT GAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGT CTGTTT GGT GGGCGAT G 1680 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1741 TAT CT CCT GT T TT CT T GAAGAAC AGGAAAAAT GG C CAAAAAT CAT C CT T T C C ACT T GCT A 1800 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II 
Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGT^AATCTTTCCAGTCCT 1860 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

I I I I I I I I I I I I I II I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 19 80 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 204 0 

II I II I I I I I I I II I I I I I I I I I I I II I I I I I II I I I I I I I I I I II I I I II I I I I I I I I I 

Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2040 

Qy 2041 T GC C CCTACTAT CTAT CAT GGAATAACAT C CAAGAAAGAC AC CTTGCAT AT T CTTT CAGT 2100 

I I I I M I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I 
Db 2 041 T GC C C CTACTAT CTAT CAT GGAATAACAT C CAAGAAAGACACCT T GCATATT CTT TC AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 



Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | || M 
Db 2221 C AGT GAG CTCCTTCTTGGCT GAG C AG G CAT G GAG AC T G T AG GT T T C C AG AT T T C C T G AAA 228 0 

Qy 2281 AAT AAAAGT T T AC AG C GT TAT C T C T C C C C AAC C T C AC T AA 232 0 

M I II I II I I I I I I I I M I I I I I I II I I I I I I I I I I I I I 
Db 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2 32 0 



RESULT 11 
ADD38440 

ID ADD38440 standard; cDNA; 2320 BP. 
XX 

AC ADD38440; 
XX 

DT 15-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/transmembrane protein PRO178 0. 
XX 

KW Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 

KW immune response; cardiac insufficiency disorder; calcium flux; 

KW umbilical vein endothelial cell; bone disorder; cartilage disorder; 

KW arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 

KW Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease; 

KW dermatitis; herpetiformis; Crohn's disease; thalassaemia . 

XX 

OS Homo sapiens . 
XX 



PN US2003096955-A1. 
XX 



PD 
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XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 
PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 
PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 
PI Williams PM, Wood WI ; 
XX 

DR WPI; 2003-787000/74. 
DR P-PSDB; ADD38441. 
XX 

PT Novel isolated PRO polypeptide, useful for treating cancerous tumors, 
PT cardiac insufficiency disorders, wound healing, diabetes mellitus, 
PT thalassemias. 
XX 

PS Claim 2; SEQ ID NO 281; 556pp; English. 
XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

CC transmembrane protein) having at least 80% amino acid sequence identity 

Query Match 100.0%; Score 2320; DB 9; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I M I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I M I I I I I I I 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I I I I I I I I I I I I I I M I I I | I I M | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

Qy 121 GCT CT CAGAGGCT GCCAAAAT C CT GACAATAT CTACAGTAGGTGGAAGCCATTAT CT ACT 18 0 

I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GCT CT CAGAGGCT GC CAAAAT CCT GACAATAT CTACAGTAGGT GGAAGCCATTAT CT ACT 18 0 



Qy 181 GAT G GAC CGGGTTTCT C AGAT T CT T C AAGAT C AC GGT C AT AAT GT C AC CAT G C T TAAC C A 24 0 

I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I.I I I I I I I I I I I.I I I || I I I I I I I I I I I 
Db 181 GAT GGAC C GGGTT T CT CAGAT T C TT CAAGAT C AC G GT CAT AAT GT C AC CAT G C T TAAC C A 24 0 

Qy 241 C AAAAG AG GT C C T T T TAT G C CAGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 30 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 
Db 241 CAAAAGAG GT C CTT T TAT GC CAGAT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT C AG 300 

Qy 3 01 T T GGCT T GCAC CT GAAGAT CAT CAAAGAGAAT T T AAAAAGAGT T T T GAT TTCTTTCTG GA 360 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 301 TT GGCT TGCACCT GAAGAT CAT CAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 

Qy 3 61 AGAAACT T TAG GT GGCAGAG GAAAAT T T GAAAACT T AT T AAAT GT T C T AGAAT ACT T GG C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 3 61 AGAAACTTTAGGTGGCAGAGGAAAATTTGAAAACTT ATT AAAT GTTCT AGAAT ACTTGGC 420 

Qy 421 GTT GCAGTGCAGT CATTTTTTAAATAGAAAGGATAT CAT GGATTCCTTAAAGAATGAGAA 4 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I II I I I I 
Db 421 GT T G C AGT GC AGT C AT TT T T TAAAT AGAAAG GAT AT CAT G GAT T C C T TAAAGAAT GAGAA 4 80 

Qy 4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 481 CT T C GAC AT GGT GAT AGT T GAAACT T T T GACT ACT GT C CT T T C CT GATT G CT GAGAAGCT 54 0 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I 

Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I 

Db 601 AAT C CCCTT GT CTT AT GTT CCAGT AT T C CGTT CCTT GCT GACT GAT CACAT GGACTT CT G 660 

Qy 661 GGGC C GAGT GAAGAAT TT T CT GAT GT T CTT T AGTT T C T GC AGGAG GCAAC AG CACAT G C A 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

Qy 721 GT CT AC ATT T G ACAAC AC CAT C AAGGAAC AT T T C AC AGAAGGC T CT AGGC C AGT T T T GT C 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GT CT AC AT T T GAC AAC AC CAT C AAGGAACAT T T C AC AGAAGGC T CTAGGC C AGT T T T GT C 7 80 

Qy 7 81 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I II I I I I I I I II I I I I I 
Db 7 81 T CAT CT T C T AC T GAAAGC AGAGT T GT GGTT CAT T AACT CT GACT T T G CCT TT GAT T T T G C 84 0 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9 01 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

Qy 9 61 GAC CTTGGGCTC CAT GGT G AAC AC C T GT CAG AAT C C G GAAAT CTT C AAG GAG AT GAAC AA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I 
Db 961 GAC CT T G GGCT C CAT GGT GAAC AC C T GT CAGAAT C C GGAAAT CTT C AAG GAGAT GAAC AA 1020 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

10 81 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I II II I I I II I I I I 

1141 G G C T C AC C C AAG CAT C C GT CT GT T T GT C AC C C AC GG C G G G C AGAAT AGC AT AAT G GAG G C 1200 

1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

1261 G GT C C G AGT AGAAG C C AAAAAGT TTGGTGTTT CT AT T C AG T T AAAGAAG C T C AAG G C AG A 1320 

I I I I I I I I I I II I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

1261 G GT C C GAGT AG AAG C C AAAAAGT TTGGTGTTT CT AT T C AGT T AAAGAAGCT C AAG GC AG A 132 0 

1321 GACATT GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGTCC GCGGCAGT 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I 

1321 G AC AT T G G C T C T T AAG AT GAAACAAAT CAT G GAAGAC AAG AG AT AC AAGT C C G C G G C AGT 138 0 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

1441 GATT GAC C AC GT C C T C C AGAC AGGGGGC GC GAC G CAC C T C AAG C C CT AT GT CT T T C AG C A 1500 

I I I I I I I I I I I I I II I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

I I I I I I I I I I I I II II I I II I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I M 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 



Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

M I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I M I I I I | | | | | 
Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 19 8 0 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

I I I I I I I I I I I I I I I 1 I II I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

Qy 2 041 T G C C C C T AC TAT C TAT CAT G GAAT AAC AT C C AAGAAAG AC AC CT T G CAT AT T CT T T C AG T 2100 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2041 T G C C CCT ACTAT C TAT CAT GGAATAAC AT C C AAGAAAGACAC CT T G CAT AT T CT T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2221 C AGT GAG CTCCTTCTTGGCT GAG C AG G CAT G GAG AC T GT AG GT T T C C AG AT T T C C T G AAA 2280 

Qy 22 81 AAT AAAAGT T T AC AG C GT TAT C T C T C C C C AAC C T C AC T AA 232 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 

RESULT 12 
ADD39396 
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XX 

AC ADD39396; 
XX 

DT 15-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/ transmembrane protein PRO17 80. 
XX 

KW Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 
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KW umbilical vein endothelial cell; bone disorder; cartilage disorder; 

KW arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 
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KW dermatitis; herpetiformis; Crohn's disease; thalassaemia . 

XX 

OS Homo sapiens. 
XX 
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Query Match 100.0%; Score 2320; DB 9; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I II I I I II I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

Qy 121 GCT CT CAGAG GCT GC CAAAAT CCT GACAAT AT CTAC AGT AGGT GGAAG C CAT T AT CT ACT 180 

I I I I I II I I I I I I I I I ! I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 121 GCT CT CAGAG GCT GC CAAAAT CCT GACAAT AT C T AC AGT AGGT G GAAGC C AT TAT C T AC T 180 

Qy 181 GAT G GAC CGGGTTTCT C AGAT T CTT CAAGAT C AC G GT C AT AAT GT C AC CAT G CT T AAC C A 240 

I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 181 GAT GGAC C G G GT T T CT C AGAT T CTT CAAGAT CAC GGT CAT AAT GT C AC CAT GCT T AAC C A 24 0 

Qy 241 CAAAAGAGGT C C T T T TAT G C CAGAT T T T AAAAAGGAAGAAAAAT CAT AT CAAGT TAT C AG 3 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CAAAAGAGGTCCTTTTATGCCAGATTTTAAAAAGGAAGAAAAAT CATATCAAGTTAT CAG 300 

Qy 301 TT GGCT T GCACCT GAAGAT CAT CAAAGAGAATT T AAAAAGAGTTTT GATT T CTTT CT GGA 360 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 301 TT GG CT T GC AC C T GAAGAT CAT CAAAGAGAAT T T AAAAAG AGT T TT GAT TTCTTTCTG GA 3 60 

Qy 361 AGAAACT T TAG GT G GC AGAGGAAAAT T T GAAAAC T TAT T AAAT GT T CT AGAAT ACT T GG C 420 

I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 361 AGAAACT T T AGGT G G C AGAGGAAAAT T T GAAAACT T AT T AAAT GTT CT AGAAT ACT T G GC 420 

Qy 421 GT T G C AGT G C AGT CAT T T T T T AAAT AG AAAG GAT AT CAT G GAT T C C T T AAAG AAT G AGAA 4 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GTT GCAGT GCAGT CATT TTTTAAATAGAAAGGATAT CAT GGATT CCTTAAAGAAT GAGAA 480 

Qy 481 C T T C GAC AT GGT GAT AGT T GAAACT T T T GACT ACT GT C CT T T C CT GAT T GCT GAGAAG C T 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 C T T C GAC AT G GT GAT AGT T GAAACT T T T GAC T AC TGTCCTTTCCT GAT T G CT GAG AAGC T 54 0 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

I I I I I I I I II I I I I I I I I I I I I | | | | | | | I I | | | | | I I I M I I I I I I I I I I I I I I I I I I I 
Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 GGGC C GAGT GAAGAAT T T T CT GAT GT T C T T T AGT T T C T G CAG GAGG CAAC AG CAC AT G C A 72 0 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I I I I 



Db 661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

Qy 721 G T C T AC AT T T G AC AAC AC CAT C AAG G AAC AT T T C AC AG AAG G C T C TAG G C C AGT T T T GT C 780 

M I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 721 GT CT AC AT T T GAC AAC AC CAT C AAG GAAC AT T T C AC AG AAG G C T C T AGG C C AGT T T T GT C 780 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I 
Db 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 9 60 

Qy 961 GAC CTTGGGCTC C AT GGT GAACAC C T GT C AGAAT C C G G AAAT C T T C AAG GAGAT GAAC AA 102 0 

I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 961 GAC CT T GGGC T C CAT G GT GAACAC CT GT CAGAAT C C GGAAAT C T T CAAGGAGAT GAAC AA 102 0 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

Qy 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

Qy 1141 G GCT C AC C CAAG CAT C C GT CT GT T T GT C AC C C AC G G C GGGC AGAAT AG C AT AAT G GAG G C 120 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I II 
Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

Qy 1201 CAT CC AG CAT GGT GT GC C CAT GGT G GGGAT CC CT C T CTT T GGAGAC C AGC CT GAAAAC AT 1260 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1201 CAT C C AG CAT GGTGTGCC CAT G GT G G G GAT CCCTCTCTTTG GAG AC C AG C C T GAAAAC AT 1260 

Qy 12 61 GGT C C GAGT AGAAGC C AAAAAGT TTGGTGTTT CT AT T CAGT T AAAGAAG C T CAAG GC AGA 132 0 

I I I I I I II I I I I I I I I I I I II I II I I II I I I I I I I I I I I I I I I I II I II I I I I I II I I I I 
Db 1261 G GT C C GAGT AGAAG C CAAAAAGT T T G GT GT T T C TATT CAGT TAAAGAAG CT C AAGGC AGA 132 0 

Qy 1321 GAC AT T GGCT CT T AAGAT GAAACAAAT C AT GGAAGACAAGAGAT ACAAGT C C GC G GC AGT 138 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I II I II I I I II II I I I I 

Db 1321 GAC AT T G G C T C T T AAG AT GAAACAAAT CAT G G AAGAC AAG AG AT AC AAGT C C G C G G CAGT 13 8 0 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I II I I I I I I I I I I I II I I I I II I I I II I I II II I I I I I I I I I II I I I I I I 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 



Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I I M I I I I I I I I I I I I I I I I I I I | I I J I I I I I I I I | | | I I I I I I | | | | | | | | | | | | M I 
Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

QY 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 4 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I | | I | | | || | | 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I 
Db 1741 TATCTCCT GTTT T CTTGAAGAACAGGAAAAAT GGC CAAAAAT CAT C CT TT CCACTT GCTA 1800 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I 
Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I 

Db 19 81 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

Qy 2041 T GCCCCT ACTAT CTAT CAT GGAAT AACAT C CAAGAAAGACAC CT T GCAT AT T CTTT CAGT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2 041 T GC C C CT ACT AT C TAT CAT GGAAT AACAT C CAAGAAAGACAC CT T GCAT AT T C T T T CAGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I II I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 

I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 CAGT GAGCT C CT T CT T GGC T GAG C AG G CAT G GAGAC T GT AGGT T T C C AGAT T T CCT GAAA 22 8 0 

Qy 22 81 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 

I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 22 81 AAT AAAAGT T T AC AGC GT TAT C T CT C C C C AAC C T C AC T AA 232 0 
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PI Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 

PI Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 

PI Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 

PI Williams PM, Wood WI ; 
XX 

DR WPI; 2003-765477/72. 

DR P-PSDB; ADD38920. 
XX 

PT New isolated PRO polypeptide such as PRO1560, PR0444, PRO1018, PR01773, 

PT PR01244, PR01246, useful for treating cancerous tumors, cardiac 

PT insufficiency disorders, wound healing, Crohn's disease, celiac disease. 

XX 

PS Claim 2; SEQ ID NO 281; 555pp; English. 
XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

Query Match 100.0%; Score 2320; DB 9; Length 2320; 

Best Local Similarity 100.0%; Pred. No . 0 ; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0 
QY 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I M M M M I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | M I I 

Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

QY 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M | | | | | | | | | II I I I I I I I II I 

Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

Qy 121 G C T C T C AGAG G CT G C C AAAAT C C T G AC AAT AT CT AC AGT AG GT G G AAG C CAT TAT CT AC T 18 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II II I I I I I I I 
Db 121 GCTCTCAGAGGCTGCCAAAATCCTGACAATATCTACAGTAGGTGGAAGCCATTATCTACT 18 0 

Qy 181 GAT G GAC C GGGT T T CT C AGAT T CT T CAAGAT C AC G GT C AT AAT GT C AC CAT GCT TAAC C A 24 0 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I 
Db 181 GAT GGAC CGGGTTTCT CAGAT T C TT CAAGAT C AC GGT CAT AAT GT C AC CAT G CT T AAC C A 24 0 

Qy 241 CAAAAGAGGTCCTTTTATGCCAGATTTTAAAAAGGAAGAAAAAT CATATCAAGTTAT CAG 300 

I M I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I 
Db 241 C AAAAGAG GT C C T T T TAT G C CAGAT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT CAG 300 

Qy 301 TTGGCTTG C AC C T G AAG AT CAT C AAAGAGAAT T T AAAAAGAG T T T T GAT TTCTTTCTG G A 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 



Qy 361 AGAAACT T TAG GT G GCAGAGGAAAAT T T GAAAACT T AT T AAAT GT T C T AGAAT ACT T GG C 42 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I | | M I I I I I I I I I I I 

Db 361 AGAAAC T T T AG GT G GCAGAG GAAAAT T T GAAAACTT AT T AAAT GT T C T AGAAT AC T T G G C 42 0 

42 1 GT T G C AGT G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAG AAT GAGAA 48 0 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I | | | | || | | | || | | || | | | | | | | | 

Db 421 GTTGCAGTG C AG T CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT GAGAA 4 80 

Qy 481 C T T C GAC AT GGT GAT AGT T GAAACT T T T GAC T ACT GT CCTTTCCT GAT T G CT GAGAAGC T 54 0 

I I I I I N I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I 

Db 481 C T T C GAC AT GGT GAT AGT T GAAACT T T T GAC T AC TGT CCTTTCCT GAT T G CT GAGAAGCT 54 0 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

I N I I I I I I I I M I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I M I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I II I I | || | | | || | | || | | | | | | | 
Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 6 61 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 661 GG GCC GAGT GAAGAAT T T T CT GAT GT T C T T T AGT T T CT G C AG GAG G CAAC AG CAC AT GC A 72 0 

Qy 7 21 GT CTACAT T T GACAAC AC CAT CAAGGAACATTT CACAGAAGGCT CTAGGC CAGT T TT GT C 7 80 

I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | 

Db 721 GT C TACAT T T GACAACAC CAT CAAG GAAC AT TT C AC AGAAG G CT C T AGGC C AGT T TT GT C 7 80 

Qy 7 81 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I | | | | | | | | | | | | 
Db 7 81 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 9 00 

I I I I I I M I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 9 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 9 60 

Qy 961 GAC CTTGGGCTC CAT GGT GAAC AC C T G T C AGAAT C C G GAAAT C T T CAAG GAG AT G AAC AA 1020 

I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 961 GAC CT T GG GCT C CAT G GT GAAC AC CT GT CAGAAT C C GGAAAT CT T CAAGGAGAT GAACAA 102 0 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1021 TGCCTTTGCTCACCTACCCCT^AGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

Qy 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I 
Db 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

Qy H41 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

i I i M I I I I II M M I II I I I I I II I I I I | | | | || || | | || | | || | M I I I II II II II I 
Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 



Qy 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 



I I M I M I I M I I I II I I I I I I I I I I I II I I I I I I I || I | | | | | | | | | | | | | | | | | | | | | 

Db 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

Qy 12 61 G GT C C G AGT AGAAG C C AAAAAGT TTGGTGTTTC TAT T C AGT T AAAGAAG C T C AAG G C AG A 132 0 

I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I || I I | | | | | | | | | | | | | | | | | | | | | | | | 
Db 12 61 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 132 0 

Qy 1321 GAC AT T G G C T C T TAAGAT GAAAC AAAT CAT G GAAGAC AAGAGAT ACAAGT C C G C GG C AGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1321 GAC AT T G G C T CT TAAGAT GAAAC AAAT CAT G GAAGAC AAGAGAT AC AAGT C C G C GG C AGT 1380 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

Qy 14 41 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I | || | | | | | | 
Db 14 41 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

Qy 15 01 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 15 60 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | M I I I I I I I I I I I I I 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 15 60 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I M I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

QY 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 40 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I 

Db 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | I I I I I I I I I I I I 

Db 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

I I I M I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I | M I I I I I II I I I I I I I I 

Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

Qy 2 041 T G C C C CT AC TAT CT AT CAT G GAAT AAC AT C C AAGAAAG AC AC C T T G CAT AT T C T T T C AG T 2100 
I I I I I I I I I I I I I I I I II I I I I I I I II I I I I II I I I I I I I I I I I I 



Db 


2041 


T GC C C C T AC TAT CT AT CAT G GAAT AAC AT C C AAGAAAGAC AC C T T G CAT AT T C T T T C AG T 


2100 


Qy 


2101 


TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 

1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | || | M | | | | | | | | | 

TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 


2160 


Db 


2101 


2160 


Qy 


2161 


AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 I I I I I M 1 1 I I I I | | | | | | | | | | | | 
AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 


2220 


Db 


2161 


2220 


Qy 


2221 


CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 

1 | | 1 | 1 1 1 1 1 1 1 | 1 1 I i i i i i i j i i i j i ii i i i i i i i i i i i i i i i i i i , . , , 

> 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 
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Db 
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Qy 
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AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 
1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | M | 
AATAAAAGT TTACAGCGTT AT CT CT CC C CAACCT CACTAA 232 0 
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ADD40350 standard; cDNA; 2320 BP. 
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Human cDNA encoding secreted/transmembrane protein PRO1780. 
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Human; ss; 


gene; secreted protein; transmembrane protein; PRO; tumour; 
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immune response; cardiac insufficiency disorder; calcium flux; 


KW 


umbilical vein endothelial cell; bone disorder; cartilage disorders- 


KW 


arthritis ; 


wound healing; diabetes; skeletal muscle cells; obesity; 


KW 


Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease 


KW 
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herpetiformis; Crohn's disease; thalassaemia . 
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Homo sapiens. 
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XX 






PD 


01-MAY-2003 




XX 






PF 


06-DEC-2001 


; 2001US-00006117. 


XX 






PR 


01-SEP-1998 


98US-0098716P. 


PR 


01-SEP-1998 


98US-0098723P. 


PR 


01-SEP-1998 


98US-0098749P. 


PR 


01-SEP-1998 


r 98US-0098750P. 


PR 


02-SEP-1998 


98US-0098803P. 


PR 


02-SEP-1998 


; 98US-0098821P. 


PR 


02-SEP-1998 


? 98US-0098843P. 


PR 


09-SEP-1998, 


98US-0099536P. 


PR 


09-SEP-1998, 


98US-0099596P. 


PR 


09-SEP-1998, 


98US-0099598P. 


PR 


09-SEP-1998, 


98US-0099602P. 


PR 


09-SEP-1998, 


98US-0099642P. 


PR 


10-SEP-1998, 


98US-0099741P. 



PP 
r r\ 


i n 
1 u 


Q TPD 

— b£ir 


1 Q Q O 

iy y o 


; 98US 


-0099754P . 


PP 
r K 


1 n 
1 u 


C T? D 


- iy y o 


; 98US 


-00997 63P . 


PP 


1 u 




— iyy o 


; 98US 


r\ C\ c\ r\ *~t r\ 

-0099792P . 


PP 




C TP T> 


1 QQQ 

— iy y o 


; 98US 


-00998 08P . 


PD 
r K 


1 U 


Q T7 D 


1 o n o 

-iy y o 


; 98US 


-0099812P . 


PP 
r K 


1 u 


C TP D 

— bh.P 


-±y y o 


; 98US 


-0099815P. 


PP 
r K 


1 u 


C TP D 


- iy y o 


; 98US 


-00998 16P . 


PP 


ID 


_ C T7 1 D 


1 QQQ 

- 1 y y o 


; 98US 


-0100385P . 


DD 
r K 


ID 


-oir 


1 Q ft O 

- iy y o 


; 98US 


-0100388P . 


D O 

r K 


1 R 

ID 


-SEP 


1 ft ft o 

-iy y o 


; 98US 


-0100390P . 


rK 


lb 




-1998 


; 98US 


-0100584P . 


DD 

rK 


1 D 


-ohP 


"1 ft ft o 

- iy y o 


; 98US 


-0100627P . 


DD 

r K 






1 ft ft o 

"iy y o 


; 98US 


-0100661P . 


D D 


1 b 


-SEP 


"1 ft ft o 


; 98US 


-0100662P. 


DD 

IrK 


i a 
lb 


C TP D 


1 ft ft Q 

-ly 9o 


; 98US 


-0100664P. 


DD 

r K 


1 / 


-SEP- 


1 ft ft o 

-iy y o 


; 98US 


-0100683P . 


D D 

rK 


1 / 


-SEP- 


-1998 


; 98US- 


-0100684P. 


DD 

rK 


1 f- 


-SEP- 


-1998 


; 98US- 


-0100710P. 


D D 

rK 


1 /" 


-SEP- 


-1998 


; 98US- 


-0100711P. 


DD 

rK 


1 /" 


-SEP- 


1 ft ft o 

-19 98 


; 9 8US- 


-0100919P. 


D D 

rK 


1 /- 


-SEP- 


-1998 


; 98US- 


-0100930P . 


rK 


lo- 


-SEP- 


-1998 


98US- 


-0100848P. 


D D 

rK 


1 Q 

1 o- 


-SEP- 


-1998 


; 9 8US- 


-0100849P. 


DD 

rK 


1 Q 

lo- 


-SEP- 


-1998 


? 98US- 


-0101014P. 


rK 


1 o 

I o - 


-SEP- 


-1998 


r 98US- 


-0101068P. 


DD 

rK 


1 o 
lo- 


-SEP- 


-1998 1 


98US- 


-0101071P. 


D D 

r K 


ft o 

ZZ- 


-SEP- 


1 ft ft o 

-1998 , 


98US- 


-0101279P . 


DD 

rK 


o o 
zj- 


-SEP- 


i ft ft ft 
-1998 , 


98US- 


-0101471P. 


D D 

r K 


Z o~ 


-SEP- 


-1998 , 


98US- 


-0101472P . 


DD 

rK 


o o 

zo- 


-SEP- 


-1998 , 


98US- 


-0101474P. 


D D 

rK 


ZD- 


-SEP- 


T ft ft ft 

■1998 ; 


98US- 


-0101475P . 


DD 

rK 


Zo- 


-SEP- 


-1998; 


98US- 


-0101476P . 


D D 

rK 


o o 
zj- 


-SEP- 


1 ft ft o . 

1998; 


98US- 


-0101477P. 


rK 


Zo- 


-SEP- 


1 ft ft o « 

19 98; 


98US- 


-0101479P. 


D D 

rK 


Z 4 - 


•SEP- 


1998 ; 


98US- 


-0101738P . 


DD 

rK 


O A 

Z 4- 


■SEP- 


1998; 


98US- 


0101741P. 


D D 

rK 


Z 4 - 


SEP- 


1998 ; 


98US- 


-0101743P . 


DD 

rK 


O A 

Z 4~ 


C TP D 


1 ft ft o . 

i y y o ; 


98US- 


0101915P . 


D D 

rK 


Z 4 - 


SEP- 


1 ft ft o » 


98US- 


0101916P . 


D D 

rK 


z y- 


o tp d 


T ft ft O . 

19 98; 


98US- 


0102207P. 


D D 

rK 


z y- 


SEP- 


1 ft ft o » 

1998 ; 


98US- 


0102240P . 


D D 

rK 


z y- 


c? tp n 

oh,P- 


1 ft ft o . 

19 98; 


98US- 


0102307P . 


DD 

rK 


z y — 


CTTD 

bJlr- 


1 ft ft o . 

iy y o ; 


9 8US- 


0102330P . 


DD 

rK 


z y- 


C TP Ti 


1998; 


98US- 


0102331P . 


DD 

rK 


o U — 


SEP- 


1 ft ft O • 

i y y o ; 


98US- 


01024 84P . 


DD 
rK 


-J U — 


O TP D 


1 ft. ft. o . 

i y y o ; 


98US- 


0102487P . 


DD 
r K 


o U 


TP D 


i y y o ; 


98US- 


010257 OP . 


DD 
r K 


jU 


o rr 1 n 


1 ft ft o . 

iy y o ; 


98US- 


0102571P . 


DD 
r K 


u 1— 


Apm 

UL1 - 


1 ft ft o . 

i y y o ; 


98US- 


0102684P . 


DD 

r K 


U 1 — 


Ut I - 


T ft ft O . 

i y y o ; 


98US- 


0102687P . 


DD 
rK 


UZ 


1 — 


1 ft ft o . 

i y y o ; 


98US- 


0102965P . 


DP 
r K 


u o 


UL. 1 — 


1 QQQ , 

i y y o ; 


98US- 


a -i nil r nn 

0103258P . 


PR 


06- 


OCT- 


1998; 


98US- 


0103449P. 


PR 


07- 


OCT- 


1998; 


98US- 


0103314P. 


PR 


07- 


OCT- 


1998; 


98US- 


0103315P. 


PR 


07- 


OCT- 


1998; 


98US- 


0103328P. 


PR 


07- 


OCT- 


1998; 


98US- 


0103395P. 



PR 07-OCT-1998 

PR 07-OCT-1998 

PR 08-OCT-1998 

PR 08-OCT-1998 

PR 08-OCT-1998 

PR 08-OCT-1998 

PR 14-OCT-1998 

PR 20-OCT-1998, 

PR 20-OCT-1998, 

PR 20-OCT-1998, 

PR 21-OCT-1998, 

PR 22-OCT-1998, 

PR 22-OCT-1998, 

PR 26-OCT-1998; 

PR 26-OCT-1998; 



PR 


27 


-OCT 


-1998 


PR 


27 


-OCT 


-1998 


PR 


27 


-OCT 


-1998 


PR 


27 


-OCT 


-1998 


PR 


28 


-OCT 


-1998 


PR 


28 


-OCT 


-1998 


PR 


28 


-OCT 


-1998 


PR 


28 


-OCT 


-1998 


PR 


28 


-OCT 


-1998 


PR 


28 


-OCT 


-1998 


PR 


29 


-OCT- 


-1998 


PR 


29 


-OCT- 


-1998 


PR 


29 


-OCT- 


-1998 


PR 


30 


-OCT- 


-1998 


PR 


03- 


-NOV- 


-1998 


PR 


03- 


-NOV- 


-1998 


PR 


03- 


-NOV- 


-1998, 


PR 


03- 


-NOV- 


-1998, 


PR 


03- 


-NOV- 


-1998, 


PR 


03- 


-NOV- 


-1998, 


PR 


10- 


-NOV- 


-1998, 


PR 


17- 


-NOV- 


-1998; 


PR 


17- 


-NOV- 


-1998; 


PR 


17- 


-NOV- 


-1998; 


PR 


17- 


-NOV- 


-1998; 


PR 


17- 


-NOV- 


-1998; 


PR 


17- 


-NOV- 


•1998; 


PR 


17- 


-NOV- 


1998; 


PR 


17- 


-NOV- 


1998; 


PR 


17- 


-NOV- 


1998; 


PR 


17- 


-NOV- 


1998; 


PR 


18- 


NOV- 


1998; 


PR 


18- 


NOV- 


1998; 


PR 


18- 


NOV- 


1998; 


PR 


18- 


NOV- 


1998; 


PR 


18- 


NOV- 


1998; 


PR 


18- 


NOV- 


1998; 


PR 


18- 


NOV- 


1998; 


PR 


22- 


DEC- 


1998; 


PR 


30- 


DEC- 


1998; 


PR 


05- 


JAN- 


1999; 


PR 


16- 


APR- 


1999; 



98US-0103396P 

98US-0103401P 

98US-0103633P 

98US-0103678P 

98US-0103679P. 

98US-0103711P. 

98US-0104257P. 

98US-0104987P. 

98US-0105000P. 

98US-0105002P. 

98US-0105104P. 

98US-0105169P. 

98US-0105266P. 

98US-0105693P. 

98US-0105694P. 

98US-0105807P. 

98US-0105881P. 

98US-0105882P. 

98US-0106062P. 

98US-0106023P. 

98US-0106029P. 

98US-0106030P. 

98US-0106032P. 

98US-0106033P. 

98US-0106178P. 

98US-0106248P. 

98US-0106384P. 

98US-0108500P. 

98US-0106464P. 

98US-0106856P. 

98US-0106902P. 

98US-0106905P. 

98US-0106919P. 

98US-0106932P. 

98US-0106934P. 

98US-0107783P. 

98US-0108775P. 

98US-0108779P. 

98US-0108787P. 

98US-0108788P. 

98US-0108801P. 

98US-0108802P. 

98US-0108806P. 

98US-0108807P. 

98US-0108867P. 

98US-0108925P. 

98US-0108848P. 

98US-0108849P. 

98US-0108850P. 

98US-0108851P. 

98US-0108852P. 

98US-0108858P. 

98US-0108904P. 

98US-0113296P. 

98US-0114223P. 

99WO-US000106. 

99US-0129674P. 



PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

PR 

XX 

PA 

XX 

PI 
PI 
PI 
PI 

XX 
DR 
DR 
XX 
PT 
PT 
PT 
XX 
PS 
XX 

cc 



23- JUN 
2-0-JUL 
2 6- JUL 

01- SEP- 

15- SEP- 
2 9-OCT- 
30-NOV- 

02- DEC- 

16- DEC- 

05- JAN - 

06- JAN- 
11-FEB- 
18-FEB- 

24- FEB- 
02-MAR- 
15-MAR- 

17- MAY- 

22- MAY- 
30-MAY- 
02-JUN- 

23- AUG- 

24- AUG- 
08-NOV- 
10-NOV- 
01-DEC- 
28-FEB- 
01-MAR- 
01-JUN 
2 0-JUN 
2 9-JUN 
0 9-JUL- 
04-SEP- 



1999; 
1999; 
1999; 
1999; 
1999; 
1999; 
1999; 
-1999; 
-1999; 
-2000; 
-2000; 
-2000; 
-2000; 
-2000; 
-2000; 
-2000; 
-2000; 
-2000; 
-2000; 
-2000; 
-2000; 
-2000; 
-2000; 
■2000; 
-2000; 
■2001; 
■2001; 
•2001; 
■2001; 
■2001; 
2001; 
2001; 



99US 
99US 
99US 
99WO 
99WO 
99US 
9 9WO 
99WO 
99WO 
2000WO- 
200 0WO- 
2000WO- 
2000WO- 
2000WO- 
2000WO- 
200 0WO- 
2000WO- 
2000WO- 
2000WO- 
2 000WO- 
2000WO- 
2000WO- 
2 000WO- 
2 000WO- 
2000WO- 
2001WO- 
2001WO- 
2 001WO- 
2001WO 
2 0 01WO- 
2 001WO- 
2001US 



0141037P. 
-0144758P. 
-0145698P. 
-US020111. 
-US021194. 
-0162506P. 
-US028313. 
-US028551. 
-US030095. 
-US000219. 
-US000376. 
■US003565. 
-US004342. 
-US005004. 
-US005841. 
•US006884. 
US013705. 
•US014042. 
US014941. 
US015264. 
US023522. 
US023328. 
US030952. 
US030873. 
US032678. 
US006520. 
US006666. 
US017800. 
US019692. 
US021066. 
US021735. 
00946374. 



(GETH ) GENENTECH INC. 

Baker KP, Botstein D, Desnoyers L, Eaton DL, Ferrara N, Fong S; 
Gao W, Goddard A, Godowski PJ, Grimaldi JC, Gurney AL, Hillan KJ; 
Pan J, Paoni NF, Roy MA, Smith V, Stewart TA, Tumas D, Watanabe CK; 
Williams PM, Wood WI ; 

WPI; 2003-755104/71. 
P-PSDB; ADD40351. 

New isolated PRO polypeptides such as PRO1560, PR0444, PRO1018, PR01773, 
PR01244, PR01246, are useful for treating cancerous tumors and cardiac 
insufficiency disorders. 

Claim 2; SEQ ID NO 281; 550pp; English. 

The invention relates to an isolated PRO polypeptide (secreted or 



Query Match 100.0%; Score 2320; DB 9; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 2320; Conservative 0; Mismatches 



Length 2320; 
0; Indels 0; Gaps 



0 



Qy 



AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 
1 1 11 1 1 I I M I II I I I I I I I I I I I | | | | | I I I I I I I I | I | | M M I I I II I II I I I I 



1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I M I I I I M I I I I I I I I II I I I II I I I I | | | | | | M II I I I I I I I I I I | | I I I I 
61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

121 G CT C T C AGAG G CT GC CAAAAT C CT GAC AAT AT CT ACAGT AGGT G GAAG C CAT T AT CT ACT 18 0 

I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I M I I I I I I I I I I I | | | | | | | | | | | | | | | 
121 GCTCTCAGAGGCT GC CAAAAT C CTGACAAT AT CT ACAGT AGGT GGAAGC CATTAT CTACT 18 0 

181 GAT G GAC CGGGTTTCT C AGAT T C T T C AAGAT C AC G GT CAT AAT GT C AC CAT G CT T AAC C A 24 0 

I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I II I I I I I I | | | | | M | | | | | | | || | | 
181 GAT G GAC CGGGTTTCT CAGAT T C T T CAAGAT CAC G GT CAT AAT GT C AC CAT GCT T AAC C A 24 0 

241 CAAAAGAG GT C CT T T TAT G C CAGAT T T TAAAAAG GAAGAAAAAT CAT AT CAAGT TAT C AG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 

241 CAAAAGAG GT C C T T T TAT G C CAGAT T T TAAAAAG GAAGAAAAAT CAT AT C AAG T TAT C AG 300 

301 TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 

I I I I I I I I I I I || I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | || | | | | | | | | | 

301 TTGGCTTG CAC C T GAAG AT CAT C AAAG AG AAT T T AAAAAGAGT T T T GAT TTCTTTCTG G A 360 

3 61 AG AAAC T T TAG G T G G C AG AG G AAAAT T T GAAAAC T TAT T AAAT G T T C T AGAAT A C T T G G C 420 
I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I | | | | | | | | | | | | | | | | | 

3 61 AGAAACT T TAG GT GG CAGAGGAAAAT T T GAAAACT TAT T AAAT GT T C TAGAATACT T G G C 42 0 

421 GT T G C AGT G C AGT CAT T T T T T AAAT AGAAAGGAT AT C AT GGAT T C CT T AAAGAAT GAGAA 48 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

421 GT TGCAGT GCAGT CATTTTTTAAAT AGAAAGGAT AT CAT GGATTCCTTAAAGAAT GAGAA 4 80 

4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I I I I M I I I I I I I I I I I I I I I I I I || | | | | | | | | | | | | | | | | | | | | M | | | | | 

481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

661 G G G C C GAG T G AA G AAT T T T C T GAT G T T C T T T AG T T T C T G C AG GAG G C AAC AG CAC AT G C A 72 0 

I I I I I II I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I 

661 GG GC C GAGT GAAGAAT T T T CT GAT GT T CT T T AGTT T CT GC AGGAG GCAAC AG CAC AT G C A 72 0 

721 GT CT AC AT T T GAC AAC AC CAT C AAG G AAC AT T T C AC AGAAG G C T C TAG G C C AGT T T T GT C 780 

I I I I M I I I I I I I I I I I I I I I I I I I | | | M | | | | | | | | | | | | | | | | | || M || | 

721 GT CT AC AT T T GACAAC AC CAT CAAG GAAC AT T T CAC AGAAG G C T CT AGG C CAGT T T T GT C 7 80 

7 81 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I M I I I II I I I I I I I I I I I I I I I I I I I | | | | | | | M I I I I I I I I I I I I I M 

7 81 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I M II I I I II I I I I I I II I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 9 00 



901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 
I I I I I I I II II I I I I I II II I I I I I |.| IN | | | | | | | | | | | | , | | | | | ,,| , | | | || | | | 

901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 
961 GACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGAGATGAACAA 1020 



1 1 1 1 1 1 1 I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

GATGAACAA 1020 



961 GACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGAi 
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TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

1 1 1 1 1 1 11 1 I I I I I I I I I M I I I I I I I I I I I I I I I I I I | I I II I I I I I I I 

TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 
1 1 1 1 1 1 I I I I I I I I I I I I I I I I I I I I I I II I | | | | I I I I I I I I I | | | II I I I I I I I I | | | 
AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

1 1 1 1 'I I I I I I I I II I I I I I I II I II I I I I I I I I I I I I I I I I I I M I I I I I I I 

GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

"HIM I I I N I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I | M I I II 

CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 



GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 
1 I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GA 1320 



1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCA 



1321 GACATTGGCTCTTAAGATGAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT 1380 



1321 
1381 
1381 
1441 
1441 
1501 
1501 
1561 



1 " I I I I I I I I I I I I I I I II I I I I I I I | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACATTGGCTCTTAAGATGAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT 1380 

GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I 1 1 1 1 1 I I I I I I I I I I I | | | | I I I I I I | | | | I I I I I I I I I I I I I I I I I I I I I | I II I I I I 
GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

II 1 1 1 1 1 I Ml I III I I II I I II I I II I I Ml II I I I I I I I I | I I I I I I I I I I I I I I I I I 
GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 
1 11 1 I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 



GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 
1CC1 1 1 1 1 1 1 11 1 ' I I I I I I I II I I I I I I I I I I I I N | I I I I I I I I I I | | | | I I I II I I I I I I I 
1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

1 1 "LLIIIliiiiL 1 ! 1 1 ! i " i-i 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii i ii 1 1 1 1 1 1 1 1 1 

G 1680 



1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGAT 1 



1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

ieoi 1 1 1 1 1 I I M I I I I I I I I I I I I I I I I I I I I | I | | | I II I I I I I I I I I I I I II I I I I 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 



®Y 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

I N I I II I I I I I I I I I I I I I I I I | | I I I I I I I I I I M I | | | I | | | | | | | | | | | | | | | | | | 

Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I M I I I I I I I | I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIM 

Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 19 8 0 

I I M I I I I I I I I II I I I I I I I I I I I I I I I I II I II I I II I II M I I 

Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

198 1 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

I I N I I M I I I I I M I I I I I I I I II I I I I I II || I I I I I I I II I I I I I | I I | | | | | M II 

Db 1981 C GAAT C ACAC C C T GACT CT T C C AG C CT C CAT GT C C AGAC C T AGT C AGC CT C T CT C AC T C C 2 04 0 

Qy 2041 T G C C C C TACT AT C TAT CAT G GAAT AAC AT C C AAGAAAG AC AC C T T G CAT AT T C T T T C AGT 2100 

I I I I I I I I I I I I M I I I I II II I || I I II II II I II I I I I I II I I I I I I || | | | || I I II 
Db 2041 TGCCCCTACT AT CTAT CAT G GAAT AAC AT CC AAGAAAG AC AC CTT GCATAT T CTTTCAGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 
I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I II I II I II I I I I I II 

Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I M I I I I I M I I I I I I I I I I I I I I I I I | I I M I I I I I I I I I I I I I I M I I | M I I II M I 

Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 C AGT GAG CTCCTTCTTGGCT GAG C AG G CAT GGAGACT GT AGGT T T C CAG AT T T C CT GAAA 22 8 0 

I I I I I I I I I N I I I I I I M I I I I I I I I I I I II I I II I I I I II I I I | | | | | | | | | | | | | | | 
Db 2221 C AGT GAG CTCCTTCTTGGCT GAG CAG G CAT G GAG AC T G TAG G T T T C C AGAT T T C C T GAAA 2280 

Qy 22 81 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 

I M II I I I I II I I I I M I I I I I I I I I I I I I || II I I I I I I 
Db 22 81 AAT AAAAGTT T AC AGC GT TAT C T CT C C C C AAC C T C AC T AA 2320 



RESULT 15 
ADE50571 

ID ADE50571 standard; cDNA; 2320 BP. 
XX 

AC ADE50571; 
XX 

DT 29-JAN-2004 (first entry) 
XX 

DE Human cDNA encoding secreted/ transmembrane protein PRO1780. 
XX 

KW Human; ss; gene; secreted protein; transmembrane protein; PRO; tumour; 

KW immune response; cardiac insufficiency disorder; calcium flux; 

KW umbilical vein endothelial cell; bone disorder; cartilage disorder; 

KW arthritis; wound healing; diabetes; skeletal muscle cells; obesity; 

KW Berger disease; nephropathy; Schonlein-Henoch purpura; coeliac disease; 

KW dermatitis; herpetiformis; Crohn's disease; thalassaemia . 
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PR 

PR 
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Homo sapiens. 
US2003069179-A1. 

10- APR-2003. 

11- DEC-2001; 2001US-00015393 . 
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XX 

CC The invention relates to an isolated PRO polypeptide (secreted or 

Query Match 100.0%; Score 2320; DB 9 ; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 

AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 
1 1 1 I I I I I I II I II II I II I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I 1 1 I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M | I I I 

AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

GCTCTCAGAGGCTGCCAAAATCCTGACAATATCTACAGTAGGTGGAAGCCATTATCTACT 18 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
GCTCTCAGAGGCTGCCAAAATCCTGACAATATCTACAGTAGGTGGAAGCCATTATCTACT 18 0 

GATGGACCGGGTTTCTCAGATTCTTCAAGATCACGGTCATAATGTCACCATGCTTAACCA 240 

1 1 1 > I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GATGGACCGGGTTTCTCAGATTCTTCAAGATCACGGTCATAATGTCACCATGCTTAACCA 240 

CAAAAGAGGTCCTTTTATGCCAGATTTTAAAAAGGAAGAAAAATCATATCAAGTTATCAG 300 
I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



M I I I I I I I I I I I I I I I II I II I | I | | | I I I II I I I I I I I I I I I I I I I 



I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGAAACTTTAGGTGGCAGAGGAAAATTTGAAAACTTATTAAATGTTCTAGAATACTTGGC 42 0 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I I I I I I I I II I I I 



M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 
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Db 
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Qy 


61 


Db 


61 


Qy 


121 


Db 


121 


Qy 


181 


Db 


181 


Qy 


241 


Db 


241 


Qy 


301 


Db 


301 


Qy 


361 


Db 


361 


Qy 


421 


Db 


421 


Qy 


481 


Db 


481 



Qy 



541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 



Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I II II I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 GG G C C GAGT GAAG AAT T T T C T GAT GT T C T T T AGT T T CT G C AGGAG G CAAC AGC AC AT GC A 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I | I I I 
Db 661 G GG C C GAGT GAAGAAT T T T C T GAT GT T C T T T AGT T T C T G C AG GAG G CAAC AG C AC AT G C A 72 0 

Qy 721 G T C T AC AT T T G AC AAC AC CAT C AAG G AAC AT T T C AC AG AAG GCTCTAGGC C A GT T T T G T C 780 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 721 GT CT AC AT T T GACAAC AC CAT CAAG GAACAT T T CAC AGAAG GC T CT AG GC CAGT T T T GT C 78 0 

Qy 7 81 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I 
Db 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 9 00 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 T C GAC CT CT GCT T C CCAACACT GTTT AT GT T GGAGGCT T GAT GGAAAAACCT AT TAAAC C 90 0 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 AGT AC C ACAAGAC T T G GAGAAC T T CAT T GC CAAGTT T GGGGAC TCTGGTTTTGTCCTTGT 960 

Qy 961 GAC CT T GGGCT C C AT GGT GAAC AC CT GT CAGAAT C C GGAAAT CTT CAAG G AGAT GAAC AA 102 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 GAC CTTGGGCTC CAT G GT GAAC AC C T GT CAGAAT C C G GAAAT CTT C AAGGAGAT GAACAA 1020 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

Qy 1081 AGAT GT C CAC CT GGCT G C AAAT GT GAAAAT T GT G GACT GGCTTCCT C AGAGT GAC CT C C T 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

Qy 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

I I II I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

Qy 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

Qy 1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1261 G G T C C GAGT AGAAG C C AAAAAG TTTGGTGTTTC TAT T C AG T T AAAG AAG C T CAAG G C AG A 1320 

Qy 1321 GAC AT T G GC T C T T AAGAT GAAAC AAAT CAT G G AAGACAAGAGAT AC AAGT C C GC G G CAGT 138 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 GAC AT T G G C T C T T AAG AT GAAAC AAAT CAT G GAAG AC AAG AG AT AC AAG T C C G C G G C AG T 1380 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 



Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 40 

Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 150 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 4 0 

Qy 1741 TAT CTCCTGTTTTCTT G AAG AAC AG GAAAAAT G G C C AAAAAT CAT C C T T T C C AC T T G C T A 1800 

I II I I I I I I I I I I I I I I I I II I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1921 T GGAC CACT GAC C CT C AGAT T T C C AGC CT T AAAAT C C AC CT T C CTT C T CAT GCGCCTCTC 1980 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2040 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1981 C G AAT C AC AC C C T GAC T C T T C C AG C C T C CAT GT C C AG AC C T AGT C AG C C T C T C T C AC T C C 2040 

Qy 2 041 T GC C C CT ACT AT CT AT CAT G GAAT AAC AT C C AAGAAAGAC AC CT T G CAT AT T C T T T C AGT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 2 041 T GC C C CT AC TAT CT AT CAT G GAAT AAC AT C C AAGAAAGAC AC C T T G CAT AT T CT T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGG7VAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 C AG T GAG CTCCTTCTTGGCT GAG C AG G CAT G GAGA C T GT AG GT T T C C AG AT T T C C T G AAA 22 8 0 



Qy 22 81 AAT AAAAGT T T AC AG C GT T AT CT C T C C C C AAC CT C AC T AA 2320 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I IN I I I 
Db 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 

Search completed: May 16, 2004, 07:36:11 
Job time : 1309 sees 
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1 

± . 


7 


9 Q Q 

z o y 




tto nn a m one it 
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Sequence 


17, Appl 
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1 
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7 


9 Q Q 

z o y 


q 


TTQ HQ ^ A A H C\ r I 1- ? 

ub-uy-Z44- /yb-1 / 


Sequence 


17, Appl 


39 


39 . 6 




7 


c: n q 07 


q 


TTC PlQ A O Q 1 

uo— uy— 4zo — ol / — 1 


Sequence 


1, Appli 


40 


39.2 


1 . 


7 


492 


4 


US- 0 9-1 34 -001 r-ft Oft 


Sequence 


0 U 0 , App 


41 


39 


1. 


7 


759 


4 


US-09-305-856B-15 


Sequence 


15, Appl 


42 


39 


1. 


7 


930 


4 


US-09-305-856B-13 


Sequence 


13, Appl 


43 


39 


1. 


7 


1200 


1 


US-08-096-623A-19 


Sequence 


19, Appl 


44 


38.8 


1. 


7 


474 


4 


US-09-62 1-976-1 8033 


Sequence 


18033, A 


45 


38. 8 


1. 


7 


11049 


4 


US-10-204-708-22 


Sequence 


22, Appl 



ALIGNMENTS 



RESULT 1 

US-09-833-381-210/c 

; Sequence 210, Application US/09833381 

; Patent No. 6672186 

; GENERAL INFORMATION: 

; APPLICANT: Robison, Keith E. 

; TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 
; FILE REFERENCE: 5800-119 

; CURRENT APPLICATION NUMBER: US/ 09/ 833 , 3 8 1 
; CURRENT FILING DATE: 2001-04-11 

PRIOR APPLICATION NUMBER: 09/516,448 
; PRIOR FILING DATE: 2000-02-29 
; NUMBER OF SEQ ID NOS : 2050 

SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 210 
LENGTH: 8 83 
TYPE: DNA 
; ORGANISM: Homo sapiens 



FEATURE : 
; NAME /KEY: misc_f eature 

LOCATION: (1) ... (883) 

OTHER INFORMATION: n = A,T,C or G 
US-09-833-381-210 

Query Match 19.5%; Score 452.2; DB 4; Length 883; 

Best Local Similarity 83.8%; Pred. No. 2.2e-129; 

Matches 511; Conservative 0; Mismatches 99; Indels 0; Gaps 0; 

Qy 331 AT TT AAAAAGAGT T T T GAT T T CT T T CT GGAAGAAAC T T T AGGT GGC AGAG GAAAAT T T GA 390 

I I I I I I I I II I I I I II I Ml I I I I I I I I I I I I I I I I I I I 
Db 881 AATTAAGAAGCATTNT GATAGCTACATAGAAAC AGCATT GGAT GGC AGAAAAGAAT CT GA 822 

Qy 391 AAAC T TAT TAAAT GT T C T AGAAT ACT T GG C GT T G CAGT GC AGT CAT T T T T TAAAT AGAAA 45 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 
Db 821 AGCCCTTGTAAAGCTAATGGAAATATTTGGGACTCAATGTAGTTATTTGCTAAGCAGAAA 762 

Qy 451 G GAT AT CAT G GAT T C CT T AAAGAAT G AGAAC T T C GAC AT G GT GAT AGT T GAAAC T T T T G A 510 

I I I I I I I I I I I II I I I I I I I I I I I I I II I I I II I II I I I I I I I I I II I I I 
Db 761 GG AT ATAAT G GAT T C C T T AAAGAAT GAGAAC TAT GAT CT G GT AT T T GT T GAAGC AT T T GA 7 02 

Qy 511 CTACTGTCCTTTCCTGATTGCTGAGAAGCTTGGGAAGCCATTTGTGGCCATTCTTTCCAC 570 

I I I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I I I I I I I II I I II I I I I I I 
Db 701 TTTCTGTTCTTTCCTGATTGCTGAGAAGCTTGTGAAACCATTTGTGGCCATTCTTCCCAC 642 

Qy 571 TTCATTCGGCTCTTTGGAATTTGGGCTACCAATCCCCTTGTCTTATGTTCCAGTATTCCG 63 0 

I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 641 CACATTCGGCTCTTTGGATTTTGGGCTACCAAGCCCCTTGTCTTATGTTCCAGTATTCCC 582 

Qy 631 TTCCTTGCTGACTGATCACATGGACTTCTGGGGCCGAGTGAAGAATTTTCTGATGTTCTT 690 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I M I I I 
Db 581 TTCCTTGCTGACTGATCACATGGACTTCTGGGGCCGAGTGAAGAATTTTCTGATGTTCTT 522 

Qy 691 T AGT T T C T GC AG GAG G C AAC AGC AC AT GCAGT CT AC AT T T GAC AAC AC CAT C AAGGAACA 750 

I I I I I I I I M II I I III I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II 
Db 521 T AGT T T CT C C AG GAG C C AAT G G GAC AT G CAGT C T AC AT T T GAC AAC AC CAT C AAG GAG C A 4 62 

Qy 751 TTTCACAGAAGGCTCTAGGCCAGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTT 810 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 4 61 TTTCCCAGAAGGCTCTAGGCCAGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTT 4 02 

Qy 811 CATTAACTCTGACTTTGCCTTTGATTTTGCTCGACCTCTGCTTCCCAACACTGTTTATGT 870 

I I I I I I I I I I I I II I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I 
Db 4 01 TGTTAACTCTGATTTTGCCTTTGATTTTGCCCGGCCCCTGCTTCCCAACACTGTTTATAT 342 

Qy 871 T G GAGG CT T GAT GGAAAAAC CT AT TAAAC CAGT AC CACAAGACT T G GAGAACT T CAT T GC 930 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | || 

Db 341 T GGAGGCT T GAT GGAAAAAC CTATTAAAC CAGT AC CACAAG TAAAT AAACAGT T GGCATT 2 82 

Qy 931 CAAGTTTGGG 940 

II I I I I I 

Db 2 81 CAGTTTGGGG 272 

RESULT 2 

US-09-8 33-381- 63 1/c 



Sequence 631, Application US/09833381 
Patent No. 6672186 
GENERAL INFORMATION: 
APPLICANT: Robison, Keith E. 

TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 
FILE REFERENCE: 5800-119 

CURRENT APPLICATION NUMBER: US/09/833, 381 
CURRENT FILING DATE: 2001-04-11 
PRIOR APPLICATION NUMBER: 09/516,448 
PRIOR FILING DATE: 2000-02-29 
NUMBER OF SEQ ID NOS: 2050 

SOFTWARE: FastSEQ for Windows Version 3.0 
SEQ ID NO 631 
LENGTH: 1056 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-833-381-631 

Query Match 18.3%; Score 424.2; DB 4; Length 1056; 

Best Local Similarity 92.2%; Pred. No. l.le-120; 

Matches 458; Conservative 0; Mismatches 38; Indels 1; Gaps 1; 



Qy 


1300 


GTTAAAGAAGCT CAAG G C AGAGAC AT T GGC T C TTAAGAT GAAAC AAAT CAT GGAAGACAA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GTT C TAT C AGTAAAGAGCT C AGG C AGAACAT G GCT CT AAGAT AAACAAT CAT GGAGAC AA 


1359 


Db 


630 


571 


Qy 


1360 


GAGATACAAGTCCGCGGCAGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCC 
MINI 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | | | | | | | | | | | | | | M 1 1 
GAGATA-AAGTCCGCGGCAGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCC 


1419 


Db 


570 


512 


Qy 


1420 


CACACAGCGGCTGGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCT 
1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 
CACACAGCGGCTGGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCT 


1479 


Db 


511 


452 


Qy 


1480 


CAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 
CAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAGCAGTACCTGCTCGACGTTTTTGTGTT 


1539 


Db 


451 


392 


Qy 


1540 


TCTGCTGGGGCTCACTCTGGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TCTGCTGGGGCTCACTCTGGGGACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGT 


1599 


Db 


391 


332 


Qy 


1600 


CTGGTGGCTGCGTGGGGCCAGAAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I II M 1 1 1 1 1 1 1 1 1 
CTGGTGGCTGCGTGGGGCCAGAAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCG 


1659 


Db 


331 


272 


Qy 

Db 


1660 
271 


GGGTCTGTTTGGTGGGCGATGTCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCC 
1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 1 1 
GGGTCTGTTTGGTGGGCGATGTCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCC 


1719 
212 


Qy 


1720 


CCATTCTCTAGTCCTTCTAGTTATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAA 
M M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CCATTCTCTAGTCATTCTAGTTATCTCCTGTTTTCTTGAAGAGTAGGAAAAATGGCCAAA 


1779 


Db 


211 


152 


Qy 


1780 


AATCATCCTTTCCACTT 17 96 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
AAT C AT CC T T T C C AC AT 135 




Db 


151 





RESULT 3 

US-09-833-381-348 

Sequence 348, Application US/09833381 
Patent No. 6672186 
GENERAL INFORMATION: 
APPLICANT: Robison, Keith E. 

TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 
FILE REFERENCE: 5 8 00-119 

CURRENT APPLICATION NUMBER: US/09/ 833 , 381 
CURRENT FILING DATE: 2001-04-11 
PRIOR APPLICATION NUMBER: 09/516,448 
PRIOR FILING DATE: 2000-02-29 
NUMBER OF SEQ ID NOS : 2050 

SOFTWARE: FastSEQ for Windows Version 3.0 
SEQ ID NO 348 
LENGTH: 4 70 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/KEY: misc_f eature 
LOCATION: (1) ... (470) 
OTHER INFORMATION: n = A,T,C or G 
US-09-833-381-348 

Query Match 16.5%; Score 382.4; DB 4; Length 470; 

Best Local Similarity 95.9%; Pred. No. 5.6e-108; 

Matches 446; Conservative 0; Mismatches 12; Indels 7; Gaps 5; 

Qy 963 CCT T GGGCTCCAT GGTGAACACCT GT CAGAAT CC GGAAATCTT CAAGGAGAT GAACAAT G 1022 

I I I I II II I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 C CTT GGGCTCCAT GGT GAACACCT GT CAGAAT CCGGAAAT CTT CAAGGAGAT GAGCAAT G 60 

Qy 1023 CCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAAAG 1082 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 61 CCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAAAG 12 0 

Qy 1083 ATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGG 1142 

I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II 
Db 121 ATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGG 18 0 

Qy 1143 CT C AC C CAAG CAT CCGTCTGTTTGT C AC C C AC G GC GG GCAGAAT AG C AT AAT G GAGGC C A 1202 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGCCA 24 0 

Qy 12 03 T C CAGCAT GGT GT GC CCAT GGT GGGGAT C C CT CT CT T T GGAGACCAGC CT GAAAACAT G G 12 62 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I 1 I I 

Db 2 41 TCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATGG 30 0 

Qy 1263 TCCGAGTAGAAGCCAAAAAG-TTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGAG 1321 

II I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T C C GAGT AGAAG C CAAAAAGT TTTGGTGTTTC TAT T C AGT T AAAGAAGCT CAAGGCAGAG 360 



Qy 1322 ACATT GGCT C - T T AAGAT GAAACAAATC AT GG — AAGACAAGAGATACAAGT CC GC - GGC 1377 

II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I III 
Db 361 ACATT GGCT CT T T AAGAT GAAACAAAT CAT GGGAAGGACAAGAGATACAAGT CC GC GGGC 42 0 



Qy 1378 AGTGGCT--GCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCC 1420 

I I I I I I I I II I I I I I I I I II II I I I I MM I II 

Db 421 AGTGGCTTGCCAGTGTTCNTCCTGCGTTCCCACCCGTTCAGGCCC 4 65 



RESULT 4 

US-09-976-594-241 

; Sequence 241, Application US/09976594 

; Patent No. 6673549 

; GENERAL INFORMATION: 

; APPLICANT: Furness, Michael 

; APPLICANT: Buchbinder, Jenny 

; TITLE OF INVENTION: GENES EXPRESSED IN C3A LIVER CELL CULTURES TREATED WITH 
STEROIDS 

; FILE REFERENCE: PA-0041 US 

; CURRENT APPLICATION NUMBER: US/09/976,594 

; CURRENT FILING DATE: 2001-10-12 

; PRIOR APPLICATION NUMBER: 60/240,409 

; PRIOR FILING DATE: 2000-10-12 

; NUMBER OF SEQ ID NOS : 1143 

SOFTWARE: PERL Program 
; SEQ ID NO 241 

LENGTH: 2 966 
; TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE : 

NAME/KEY: mis cofeature 
; OTHER INFORMATION: Incyte ID No. 6673549 997080.1 
US-09-976-594-241 

Query Match 6.2%; Score 143.2; DB 4; Length 2966; 

Best Local Similarity 48.3%; Pred. No. 2.2e-33; 

Matches 542; Conservative 0; Mismatches 553; Indels 27; Gaps 4; 

QY 437 T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT GAGAAC T T C GAC AT G GT GAT A 4 96 

Ml I II M I II I I II I I I II I I I I I I III 

Db 411 T T TAT C T ACAAT C AGAC G C T TAT GAAGAAG C T ACAGGAAAC CAACT AC GAT GT AAT G CT T 470 

Qy 497 GTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCTTGGGAAGCCATTTGTG 55 6 

III III MM I I I I I I M I I II I II II I I I | I I || 

Db 471 ATAGACCCTGTGATTCCCTGTGGAGACCTGATGGCTGAGTTGCTTGCAGTCCCTTTTGTG 53 0 

Qy 557 GCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGG GCTACCAATC 604 

Mill I I II I II I MMI 

Db 531 C T C AC AC T T AGAAT T T C T G T AG GAG G C AAT AT G GAG C GAAGC T GT G G GAAAC T T C C AG C T 590 

Qy 605 CCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTGGGGC 664 

M I I I II II I M M I I I II II Ml III II 

Db 591 C C ACT T T C C TAT GT AC C T GT GC CT AT GACAGGAC TAACAGAC AGAAT GAC CT T T C T G GAA 650 

Qy 665 C GAG T G AAG AAT T T T C T GAT G T T C T T T AGT T T C T G C AG GAG G C AAC AG C AC AT G C AG T C T 72 4 

M I I I I II II MM II Ml I M II I I III 

Db 651 AGAGT AAAAAAT T CAAT G C T T T C AGT TT T GTT C CACT T C T G GAT T CAG GAT T AC GAC TAT 710 

Qy 725 AC AT T T GAC AACAC CAT C AAG GAAC AT T T C AC AGAAG G C T CT AG G C C AGT T T T GT CT CAT 784 

III I II I M I I I I II I I I I I 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



711 CATTTTTGGGAAGAGTTTTATAGTAAGGCATTAGGAAGGCCCACTACA TTATGTGAG 7 67 

785 CTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCTCGA 84 4 

M I I I I I I I I I I I I I I I I || | I I I I I I II | I I I 

768 ACT GT G G GAAAAG C T GAGAT AT G G C T AAT AC GAAC AT AT T GG GAT T T T GAAT T T C CT C AA 82 7 

845 CCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACCAGTA 9 04 

II I UNI II I I II I I M II IN II I I I I I I I I I 

828 CCATACCAACCTAACTTTGAGTTTGTTGGAGGATTGCACTGTAAACCTGCCAAAGCTTTG 8 87 

905 CCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGACC 964 

II Ml I I I I I I I | I I I I I I I N I I I I I 

8 88 C C TAAGGAAAT G GAAAAT T T T GT C C AGAGT T C AGGG GAAGAT G GT ATT GT GGT GT T T T C T 947 

965 TT GGG CT C CAT GGT GAAC AC C T GT CAGAAT CC GGAAAT CT T C AAG GAGAT GAACAAT GC C 1024 

I I I I I I I I I I I I I M M II II III 

948 CTGGGGTCACTGTTTCAAAATGTTACAGA AG AAAAG G CT AAT AT CAT T G C T T C AGC C 1004 

1025 T T T GC T C AC CT AC C C CAAG G GGT GAT AT G GAAGT GT CAGT GT T CT CAT T GGC C CAAAGAT 1084 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I | 
1005 C T T G C C C AG AT C C C AC AGAAG GT GT TAT G GAG GT AC AAAG GAAAAAAAC CAT C C AC A 10 61 

1085 GTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCT 1144 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1062 T TAG GAG C CAAT ACT C GGCT GT AT GATT G GAT AC C C CAGAAT GAT C T T C T T GGT 1115 

1145 CACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGCCATC 1204 

I I I I I M M I I I I I I I I I I I I I I I I I I I I II I I 

1116 CAT C C CAAAAC CAAAGCT T T TAT C ACT CAT GGT G GAAT GAAT GG GAT CT AT GAAGCT AT T 1175 

1205 CAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATGGTC 12 64 

I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I II I 
117 6 TAC CAT GGGGT C C CT AT GGT G G GAGTT C C CAT AT TT GGT GAT C AG CT T GAT AAC AT AG CT 1235 

1265 C GAGT AGAAGC C AAAAAGT T T GGT GT T T C TAT T CAGT T AAAGAAGC T CAAG G C AGAG AC A 1324 

I I I I I I I I I I I I I I I I I I I I I II M 

1236 CACAT GAAGGCCAAAGGAGCAGCT GT AGAAATAAACTT CAAAACTAT GACAAGCGAAGAT 12 95 

1325 TTGGCTCT T AAGAT GAAAC AAAT CAT G GAAGAC AAGAGAT ACAAGT C C G C GG CAGT GGCT 1384 

M I I I I I I I I I II I I I I | | | | 

1296 T TAC T G AGG G C T T T G AGAAC AG T CAT TAC C GAT T C C T C T TAT AAAG AGAAT G C TAT GAGA 1355 

1385 GCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGGATT 14 4 4 

Ml I MM II I II I I I I II I I I II I 

1356 T TAT CAAG AAT T C AC CAT GAT C AAC C T G T AAAG C C C C TAG AT C GAG C AG T C T T C T G GAT C 1415 

14 45 GACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCAGCCC 1504 

M I I I I I II I I I I I II II I Ml III II 

1416 GAGTTTGTCATGCGCCACAAAGGAGCCAAGCACCTGCGATCAGCTGCCCATGACCTCACC 1475 

1505 TGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTG 154 6 

I M I I I I I I I I II I I I I I I I I I I I I I I 

1476 TGGTTCCAGCACTACTCTATAGATGTGATTGGGTTCCTGCTG 1517 



RESULT 5 
US-09-180-852-1 



; Sequence 1, Application US/09180852 

; Patent No. 6287834 

; GENERAL INFORMATION: 

; APPLICANT: BELANGER, Alain 

; APPLICANT: HUM, Dean W. 

; APPLICANT: BEAULIEU, Martin 

; APPLICANT: LEVESQUE, Eric 

; TITLE OF INVENTION: CHARACTERIZATION AND USE OF AN ISOLATED URIDINE 
; TITLE OF INVENTION: DI PHOSPHO-GLUCURONOSYLTRANSFERASE 
; FILE REFERENCE: 12 5 9-44 9 

; CURRENT APPLICATION NUMBER: US/09/180, 852 

CURRENT FILING DATE: 1999-02-08 
; EARLIER APPLICATION NUMBER: PCT/CA97/00328 
; EARLIER FILING DATE: 1997-05-16 
; EARLIER APPLICATION NUMBER: US 08/649,319 
; EARLIER FILING DATE: 1996-05-17 
; NUMBER OF SEQ ID NOS : 2 
; SOFTWARE: PatentlnVer. 2.0 
; SEQ ID NO 1 

LENGTH: 2107 

TYPE: DNA 
; ORGANISM: Homo sapiens 
; FEATURE: 
; NAME/KEY: CDS 

LOCATION: (52).. (1644) 
US-09-180-852-1 

Query Match 5.9%; Score 136.4; DB 3; Length 2107; 

Best Local Similarity 49.5%; Pred. No. 2.2e-31; 

Matches 473; Conservative 0; Mismatches 466; Indels 17; Gaps 4; 

Qy 593 GGGCTACCAATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATG 652 

II II I II I II I I I I I I I I I I II I I I I I I I I I I I 

Db 610 GGAT T T CT GT TCCCTCCTTCC TAT GT ACCT GT T GTT AT GT CAGAAT TAAGT GAT C AAAT G 669 

Qy 653 GACTTCTGGGGCCGAGTGAAGAATTTTCT-GATGTTCTTTAGTTTCTGCAGGAGGCAACA 711 

II I II I I I I I I I I I II I I I I I I I I I I I 

Db 670 AT T T T CAT G GAGAG GAT AAAAAAT AT GAT AT AT AT GC T TT AT T T T GACT T T T G GT T T CAA 72 9 

Qy 712 GCACATGCAGT CTACATTTGACAACACCATCAAGGAACATTTCACAGAAGGCT CTAGGCC 771 

II I III I II Mill II I I III I I I I I I I 
Db 730 GCATAT GATCTGAAGAAGT GGGACCAGTTTTATAGT GAAGTT CTAGGAAGACCCACTACA 789 

Qy 772 AGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTT 831 



Db 



790 



T TAT T T GAGAC A ATGGGGAAAGCTGAAATGTGGCTCATTCGAACCTATTGGGATTT 8 4 5 




Qy 



832 



TGATTTTGCTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACC 8 91 



Db 



846 



TGAATTTCCTCGCCCATTCTTACCAAATGTTGATTTTGTTGGAGGACTTCACTGTAAACC 905 



892 



TATTAAACCAGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTT 951 



Db 



906 



AG C CAAAC C C T T GC C T AAGGAAAT G GAAGAGT T T GT GC AGAG CT CT G GAGAAAAT G G TAT 965 



952 



T GT CCTTGTGACCTTGGGCTC CAT GGTGAACACCTGT CAGAAT CCGGAAATCTTCAAGGA 1011 
III I I I I I I I I I I I I I I II I II I I III 



Db 966 TGTGGTGTTTTCTCTGGGGTCGATGATCAGTAAC AT GT C AGAAGAAAGT GC CAAC AT 1022 

Qy 1012 GAT GAAC AAT GCCTTTGCT C AC C T AC C C C AAGG GGT GAT AT G GAAGT GT CAGT GT T CT C A 1071 

III I I I I I I I I I I I I I I I III I I I I I I I I I I 

Db 1023 GATTGCATCAGCCCTTGCCCAGATCCCACAAAAGGTTCTATGGA GATTTGA 1073 

Qy 1072 TTGGCCCAAAGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAG 1131 

I I II I I I I I I I II I I I I I I I I I I I 

Db 1074 T GG CAAGAAGC CAAAT AC T T TAG GT T C C AAT AC T C GAC T GT AT AAGT GGT T AC C C C AGAA 1133 

Qy 1132 TGACCTCCTGGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCAT 1191 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I III II I I 

Db 1134 TGACCTTCTTGGTCATCCCAAAACCAAAGCTTTTATAACTCATGGTGGAACCAATGGCAT 1193 

Qy 1192 AATGGAGGCCATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCC 12 51 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I Mill 
Db 1194 CTATGAGGCGATCTACCATGGGATCCCTATGGTGGGCATTCCCTTGTTTGCGGATCAACA 1253 

Qy 1252 T G AAAAC AT G G T C C G AGT AG AAG C C AAAAAGT TTGGTGTTT CT AT T CAGT T AAAGAAGC T 1311 

III Mill I I I I I I I I I I I I II I I I II I 

Db 1254 TGATAACATTGCT CACATGAAAGCCAAGGGAGCAGCCCTCAGT GTGGACATCAGGAC CAT 1313 

Qy 1312 C AAG GC AGAGAC AT T G G C T CT T AAGAT GAAAC AAAT CAT G GAAGAC AAGAGAT AC AAGT C 1371 

Ml I MM I I I I I I I I I I II I I 

Db 1314 GT C AAGT AGAG AT T T GC T C AAT G CAT T GAAGT CAGT CAT T AAT GAC C CT AT C T AT AAAGA 1373 

Qy 1372 CGCGGCAGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCT 1431 

II Mil I I I I I I I II I Ml 

Db 1374 GAATAT CAT GAAAT TAT CAAGAAT T CAT CAT GAT CAAC C GGT GAAGC C C CT GGAT C GAG C 14 33 

Qy 1432 GGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGT 14 91 

II I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1434 AGT CT T CT G GATT GAGT T T GT CAT G C GC CAT AAAG GAGC CAAGC AC CT T C G G GT C GC AG C 14 93 

Qy 1492 CTTTCAGCAGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGG 1547 

I II I II I I II I M II I I I I II II I I I M I I 

Db 14 94 C C ACAAC CT C AC C T GGAT C CAGT AC C AC T C T T T GGAT GT GAT AGC AT TCCTGCTGG 154 9 



RESULT 6 

US-09-356-806-39 

; Sequence 39, Application US/09356806 

; Patent No. 6586175 

; GENERAL INFORMATION: 

; APPLICANT: Penny, Laura 

; APPLICANT: Galvin, Margaret 

; APPLICANT: Miller, Andrew 

; APPLICANT: Reidy, Michael 

TITLE OF INVENTION: Genotyping Human 
; TITLE OF INVENTION: UDP-Glucuronosyltrans f erase 2B4 (UGT2B4), 2B7 (UGT2B7) 
and 

; TITLE OF INVENTION: 2B15 (UGT2B15) Genes 
; FILE REFERENCE: SEQ-22PRV2 

; CURRENT APPLICATION NUMBER: US/09/356,806 
; CURRENT FILING DATE: 1999-07-2 0 
; NUMBER OF SEQ ID NOS : 164 

SOFTWARE: FastSEQ for Windows Version 3.0 



; SEQ ID NO 3 9 

LENGTH: 1854 
; TYPE: DNA 
; ORGANISM: H. sapiens 

FEATURE: 

NAME /KEY: CDS 
; LOCATION: (15) . . . (1584) 
US-09-356-806-39 

Query Match 5.9%; Score 136; DB 4; Length 1854; 

Best Local Similarity 49.6%; Pred. No. 2.7e-31; 

Matches 469; Conservative 0; Mismatches 460; Indels 17; Gaps 4; 

Qy 603 TCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTGGG 662 

I I I I I I I I I I I I I I I II I I I II I II I I I I I II II 

Db 58 0 TCCCTCCTTCCTACGTACCTGTTGTTATGTCAGAATTAACTGATCAAATGACTTTCATGG 639 

Qy 663 GCCGAGTGAAGAATTTTCT-GATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCAG 721 

I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 64 0 AGAGGGT AAAAAAT AT GAT CT AT GT G C T T T AC TT T GACT T T T GGT T C GAAAT AT T T GAC A 699 

Qy 722 T C T AC AT T T G AC AAC AC CAT C AAG G AAC AT T T C AC AG AAG G C T C TAG G C C AG TTTTGTCT 781 

I II II III II I I I I I I I I I I I I Mill 

Db 700 T GAAGAAGTGGGAT CAGTTTTATAGTGAAGTTCTAGGAAGACCC ACTACATTATCT 755 

Qy 782 CATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCT 841 

I I I I I I II II I III I III II I I I I I I I I 

Db 756 GAGACAAT GGG GAAAGCT GAC GT AT GG C TT AT T C GAAAC T C CT GGAAT T T T C AGTT T C C A 815 

Qy 842 CGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACCA 901 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 816 TATCCACTCTTACCAAATGTTGATTTTGTTGGAGGACTCCACTGCAAACCTGCCAAACCC 875 

Qy 902 GTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTG 961 

III III MM MM I I I I I I I I I I II II I I I I 

Db 87 6 CT GC CT AAGGAAAT GGAAGACT T T GT AC AGAGCT CT GGAGAAAAT GGT GT T GT G GT GT TT 935 

Qy 962 AC CT T GGGCT C CAT GGT GAAC AC CT GT C AGAAT C C GGAAAT CT T C AAG GAGAT GAAC AAT 1021 

I II I I I I I 1 I I I I II II I II I I II I II 

Db 936 TCTCTGGGGTCAATGGTCAGTAAC AT G AC AGAAGAAAGG G C CAAC GT AAT T GC AT C A 992 

Qy 1022 GCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAAA 1081 

M I I II II I II I II III I II II I I I I I I I III 

Db 993 GCCCTGGCCCAGATCCCACAAAAGGTTCTGTGGA GATTTGATGGGAATAAA 1043 

Qy 1082 GATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTG 1141 

I I I I I III I I I II I I I I I I I M II I I I I 

Db 1044 C C AGAT AC CT T AGGT CT CAAT AC T C G GC T CT ACAAGT G GAT AC C C C AGAAT GAC C T T C T A 1103 

Qy 1142 GCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGCC 12 01 



Db 



1104 




1163 



Qy 



1202 



ATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATG 



1261 



Db 



1164 




1223 



Qy 12 62 GT C C GAGT AGAAGC CAAAAAGTT T G GT GT T T C TAT T C AGT T AAAGAAG CT C AAG G C AG AG 1321 

II I I I I I I I I I I I I I I I 1 I I I I 

Db 1224 G C T CACAT GAAG G C CAG GGGAGCAG CT GT T AGAGT GGAC T T CAAC ACAAT GT C GAGT ACA 1283 

Qy 1322 ACATT GGCT CT TAAGAT GAAACAAAT C AT GGAAGACAAGAGAT ACAAGT C C GC GGCAGT G 1381 

III I I II I I I I I I I I Mill I II 

Db 1284 GAC T T G C T G AAT GC AT T GAAGAGAGT AAT T AAT GAT C C T T CAT AT AAAGAGAAT GT TAT G 1343 

Qy 1382 GCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGG 1441 

III I I I I I II III III II I I I I 

Db 1344 AAAT TAT CAAGAAT T CAAC AT GAT CAAC CAGT GAAGC C C CT GGAT C GAGC AGT C T T CT GG 1403 

Qy 1442 AT T GAC C AC GT C C T C CAG AC AG G G G G C G C GAC G C AC C T C AAG C C C T AT GT C T T T CAG CAG 1501 

I I I I I I I I I I I I I I I I I I I I I II II 

Db 14 04 AT T GAATT T GT CAT G C G C C ACAAAGGAGC T AAACACCT T C GG GT T GC AGC C C AC GAC CT C 14 63 

Qy 1502 CCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGG 154 7 

I I I I I III II II II II I I I I I I I I I I I II 

Db 1464 ACCTGGTTCCAGTACCACTCTTTGGATGTGATTGGGTTCCTGCTGG 150 9 



RESULT 7 
US-09-356-806-7 

; Sequence 7, Application US/09356806 

; Patent No. 6586175 

; GENERAL INFORMATION: 

; APPLICANT: Penny, Laura 

; APPLICANT: Galvin, Margaret 

; APPLICANT: Miller, Andrew 

; APPLICANT: Reidy, Michael 

; TITLE OF INVENTION: Genotyping Human 

; TITLE OF INVENTION: UDP-Glucuronosyltrans f erase 2B4 (UGT2B4), 2B7 (UGT2B7) 
and 

; TITLE OF INVENTION: 2B15 (UGT2B15) Genes 
; FILE REFERENCE: SEQ-22PRV2 

; CURRENT APPLICATION NUMBER: US/09/356, 806 
; CURRENT FILING DATE: 1999-07-20 
; NUMBER OF SEQ ID NOS : 164 

; SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 7 

LENGTH: 2 092 
; TYPE: DNA 
; ORGANISM: H. sapiens 

FEATURE : 

NAME/KEY: CDS 

LOCATION: ( 38 ) . . . ( 1 62 1 ) 
US-09-356-806-7 



Query Match 5.7%; Score 131.6; DB 4; Length 2092; 

Best Local Similarity 49.2%; Pred. No. 6.8e-30; 

Matches 470; Conservative 0; Mismatches 469; Indels 17; Gaps 4; 

Qy 593 GGGCTACCAATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATG 652 

I I I I I I I I I II I I I I I II II I II I I I I I I I I I I I 

Db 593 GGACTTCTGTTCCCTCCTTCCTATGTGCCTGTTGTTATGTCAGAACTAAGTGACCAAATG 652 



Qy 



653 GACTTCTGGGGCCGAGTGAAGAATTTTCT-GATGTTCTTTAGTTTCTGCAGGAGGCAACA 711 



Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



II I I I 1 1 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 1 1 1 I I 

653 AC T T T CAT AG AG AG G GT AAAAAAT AT GAT C TAT G T G C T T TAT T T T G AAT TTTGGTTC C AA 712 

712 G C AC AT G C AGT CT AC AT T T GAC AAC AC CAT C AAG G AAC AT T T C AC AG AAG G C T C T AG G C C 771 

III I I I I I I I I II I I I I I I I I I I I 

713 AT AT T T GAC AT GAAGAAGT G GGAT C AGT T C T ACAGT GAAGT T CT AG GAAG AC C C AC 7 68 

772 AGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTT 831 

I I I I I I I I I I II I I I II I I I I I III I II 

769 T AC GT TAT C T GAG AC AAT G G C AAAAG C T GAC AT AT G G C T TAT T C G AAAC T AC T G G GAT T T 828 

832 TGATTTTGCTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACC 891 

I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I 

829 TCAATTTCCTCACCCACTCTTACCAAATGTTGAGTTCGTTGGAGGACTCCACTGCAAACC 88 8 

8 92 TAT T AAAC C AGT AC C AC AAG AC T T G GAG AAC T T CAT T G C C AAG T T T G G G GAC TCTGGTTT 951 

I I I I I I I I I I III I I I I III I I I I I I I I I I I I I 

8 89 T GC C AAAC C C C T AC C GAAG GAAAT G GAAGAGT T T GT C C AGAG C T CT G GAGAAAAT G GT GT 948 

952 T GT C CTT GT GACCTT GGGCT CCAT GGT GAACAC CT GT CAGAAT C C GGAAAT CT T CAAGGA 1011 

III I I I I I I I I I I I I I I I II I I I I I I I I I 

949 T GT GGT GT T TT CT CT GGGGT CGAT GGT C AGT AAC AC GT CAGAAGAAAG GG C CAAT GT 1005 

1012 GATGAACAATGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCA 1071 

II III II II I I I I I I I I I I I I I I I I I I I 

1006 AAT T GC AT C AG CC CT T G CCAAGAT C C C ACAAAAGGT T CT GT G GA GATTTGA 1056 

1072 TTGGCCCAAAGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAG 1131 

III III I II III I I I I I I I I I I I I 

1057 T GGGAATAAAC CAGATACTT TAGGACT CAAT ACT CGGCT GTACAAGT GGATAC C C CAGAA 1116 

1132 T GAC CTCCTGGCT C AC C CAAGC AT C C GT CT GT T T GT C AC C C AC G GC GG GC AG AAT AG CAT 1191 

I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 

1117 TGATCTTCTTGGTCACCCAAAAACCAGAGCTTTTATAACTCATGGTGGAGCCAATGGCAT 117 6 

1192 AATGGAGGCCATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCC 1251 

I II II I I I I I I I I I I I I I I I I I I I I III I I II I Ml II II 
1177 C T AT GAG G CAAT C T AC CAT G GAAT C C C TAT GGTGGGCGTTC CAT T GT T T G C AG AT C AAC C 1236 

1252 TGAAAACATGGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCT 1311 

I I I I I I I I I I I I I I I I I I I I I I II III II I 

1237 T GAT AAC AT T G CAC ACAT GAAGG C CAAG GGAG CAGC T GTT AGTT T G GACT T C C AC AC AAT 12 96 

1312 CAAG G C AG AG AC AT T G G CT C T T AAGAT GAAAC AAAT CAT G GAAG AC AAG AGAT AC AAGT C 1371 

I II I I I I I I I I I I I I I I I I I 

1297 GTCGAGTACAGACT TACT CAAT GCACT GAAGACAGTAATTAATGAT CCTTTATATAAAGA 1356 

1372 CGC GGCAGTGGCTGCCAGTGT CAT CCTGCGCTCCCACCCGCT CAGC CC CAC ACAGCGGCT 14 31 

I I II I I I I I I I I I I I I I III 

1357 GAATGCTATGAAATTAT CAAGAATTCAT CATGAT CAAC CAGT GAAG CCCCTT GAT C GAG C 1416 

1432 GGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGT 14 91 

II I I I I I I I I I I I I I I I I I I I I I II II I I 

1417 AGTCTTCTGGATTGAATTTGTCATGCGCCATAAAGGAGCCAAGCACCTTCGGGTTGCAGC 147 6 

14 92 CTTTCAGCAGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGG 154 7 
I II I I I I I III II I I I I I I I I I I I I I I I I I I 



Db 1477 CCACGACCTCACCTGGTTCCAGTACCACTCTTTGGATGTGACTGGGTTCCTGCTGG 1532 



RESULT 8 

US-09-356-806-112 

Sequence 112, Application US/09356806 
Patent No. 6586175 
GENERAL INFORMATION: 
APPLICANT: Penny, Laura 
APPLICANT: Galvin, Margaret 
APPLICANT: Miller, Andrew 
APPLICANT: Reidy, Michael 
TITLE OF INVENTION: Genotyping Human 

TITLE OF INVENTION: UDP-Glucuronosyltrans f erase 2B4 (UGT2B4), 2B7 (UGT2B7) 
and 

TITLE OF INVENTION: 2B15 (UGT2B15) Genes 
FILE REFERENCE: SEQ-22PRV2 

CURRENT APPLICATION NUMBER: US/09/356, 806 
CURRENT FILING DATE: 1999-07-20 
NUMBER OF SEQ ID NOS : 164 

SOFTWARE: FastSEQ for Windows Version 3.0 
SEQ ID NO 112 
LENGTH: 197 6 
TYPE: DNA 

ORGANISM: H. sapiens 
FEATURE : 
NAME /KEY: CDS 
LOCATION: (11) . . . (1598) 
US-09-356-806-112 

Query Match 5.5%; Score 128.4; DB 4; Length 1976; 

Best Local Similarity 49.0%; Pred. No. 6.4e-29; 

Matches 468; Conservative 0; Mismatches 471; Indels 17; Gaps 4 

Qy 593 GGGCTACCAATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATG 652 

II II I I I I I I II I I I I I I I I II I I I I I I I I I I I 

Db 569 GGATTTCTGTTCCCTCCTTCCTATGTACCTGTTGTTATGTCAGAATTAAGTGATCAAATG 62 8 

Qy 653 G AC TTCTGGGGCC GAGT G AAG AAT T T T C T - GAT GT T C T T T AGT T T C T G C AG GAG G C AAC A 711 

I I I I I I I II III I I II I Mill III I I 

Db 62 9 AT T T T CAT G GAG AG G AT AAAAAAT AT GAT AC AT AT G C T T TAT T T T G AC TTTTGGTTT C AA 68 8 

Qy 712 G C AC AT GC AGT CT AC AT T T GACAAC AC CAT C AAGGAAC AT T T CAC AGAAG G C T C TAG G C C 771 

III I I I I I I I I III I I I I I I I I I I I 
Db 68 9 AT T TAT GAT CT GAAGAAGT G G GAC C AGT T T TAT AGT GAAGTT CT AGGAAGAC C C ACT AC A 74 8 

Qy 772 AGTTTTGTCTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTT 831 

I I I I II I I I I I I I I I I I I I I I I I I I I II III 

Db 74 9 T TAT T T GAG AC A ATGGGGAAAGCTGAAATGTGGCTCATTCGAACCTATTGGGATTT 8 04 

Qy 832 TGATTTTGCTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAA.ee 8 91 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 8 05 TGAATTTCCTCGCCCATTCTTACCAAATGTTGATTTTGTTGGAGGACTTCACTGTAAACC 8 64 

Qy 8 92 TAT T AAAC C AGT AC C AC AAGAC T T G G AGAAC T T CAT T G C C AAGT T T GG G GAC TCTGGTTT 951 

I I I I I III III I I I I III I I I I II I I I I I I I 

Db 865 AG CCAAAC C C CT G CCT AAG GAAAT G GAAGAGT T T GT GC AGAGCT CT GGAGAAAAT G GT AT 924 



Qy 952 TGTCCTTGTGACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGA 1011 

III I I I MM II III I I I I I I II I I II 

Db 925 TGTGGTGTTTTCTCTGGGGTCGATGATCAGTAAC AT GT CAGAAGAAAGT GCCAACAT 981 

Qy 1012 GAT GAAC AAT GCCTTTGCT C AC C TAC C C CAAG G GGT GAT AT G GAAGT GT C AGT GTT CT C A 1071 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 982 GAT T G CAT C AG CCCTTGCC C AG AT C C C AC AAAAG GT T C TAT G G A GATTTGA 1032 

Qy 1072 TTGGCCCAAAGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAG 1131 

II II I I I I I I I II I I I I I I I I I I I 

Db 1033 T G GCAAGAAG C CAAAT AC T T T AGGT T C CAAT AC T C GACT GT ACAAGT G GT T ACC CC AGAA 1092 

Qy 1132 TGACCTCCTGGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCAT 1191 

1 1 1 1 1 1 1 1 i 1 1 1 1 1 i ii 1 1 1 i 1 1 1 1 1 1 ii iiiii; 

Db 1093 T GAC CT T CT T GGT CAT C C CAAAAC CAAAGCT T T T AT AACT CAT G GT G GAAC CAAT GG C AT 1152 

Qy 1192 AATGGAGGCCATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCC 1251 

I I I II I I I I I II II I I I I II I II II II II IIIII II I I I 
Db 1153 CTATGAGGCGATCTACCATGGGATCCCTATGGTGGGCATTCCCTTGTTTGCGGATCAACA 1212 

Qy 1252 T GAAAAC AT G GT C C GAGT AGAAG C CAAAAAGT TTGGTGTTTC TAT T CAGT T AAAGAAG CT 1311 

I I I I I II I I I I II I I I II I I I I I I I I I I 

Db 1213 T G AT AAC AT T GC T C AC AT GAAAG C CAAGGGAG CAGC C CT CAGT GT G GAC AT C AGGAC CAT 1272 

Qy 1312 CAAGGCAGAGACATT GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT C 1371 

III I I I I I I I I I I I II I I I I I 

Db 127 3 GT CAAGT AGAGAT T T GCT CAAT G CAT T GAAGT CAGT CAT T AAT GAC C C T GT CT AT AAAGA 1332 

Qy 1372 CGCGGCAGTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCT 1431 

III I I I I I II I I I I II I III 

Db 1333 GAAT GT CAT G AAAT TAT CAAG AAT T CAT CAT GAC C AAC CAAT G AAG C C C C T G GAT C GAG C 1392 

Qy 1432 GGTGGGCTGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGT 14 91 

II I M I I I I I I I II I I I I I I I I I II M I I 

Db 1393 AGT C T T CT GGAT T GAGT T T GT CAT G C GC C ACAAAGGAG C CAAG C AC C T T C GAGT C GCAG C 1452 

Qy 1492 CTTTCAGCAGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGG 1547 

II Mill IIIII I I II I I I I II I II I I I I 

Db 1453 T C ACAAC C T C AC CT GGAT C CAGT AC C ACT CT TT G GAT GT GAT AGC AT TCCTGCT GG 1508 



RESULT 9 
US-09-813-918-1 

; Sequence 1, Application US/09813918 

; Patent No. 6383789 

; GENERAL INFORMATION: 

; APPLICANT: WEBSTER, Marion et al . 

; TITLE OF INVENTION: ISOLATED HUMAN DRUG-METABOLIZING 

; TITLE OF INVENTION: PROTEINS, NUCLEIC ACID MOLECULES ENCODING HUMAN 
; TITLE OF INVENTION: DRUG-METABOLIZING PROTEINS, 
; TITLE OF INVENTION: AND USES THEREOF 
; FILE REFERENCE: CL001175 

; CURRENT APPLICATION NUMBER: US/09/813, 918 
; CURRENT FILING DATE: 2001-03-22 
; NUMBER OF SEQ ID NOS : 4 ' 

; SOFTWARE: FastSEQ for Windows Version 4.0 



; SEQ ID NO 1 

LENGTH: 1413 
TYPE: DNA 
ORGANISM: Human 

US-09-813-918-1 



Query Match 5.5%; Score 127.6; DB 4; Length 1413; 

Best Local Similarity 50.1%; Pred. No. 8.9e-29; 

Matches 378; Conservative 0; Mismatches 364; Indels 12; Gaps 



2; 



Qy 

Db 



794 AAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCTCGACCTCTGCTT 853 

I I I I I I I I I I I I I I II I I I I I I I I I I II I I 

551 AAAGCTGACATATGGCTTATGCGAAACCCCTGGAGTTTTCAATTTCCTCATCCATTCTTA 610 



Qy 



Db 



854 C C CAAC ACT GT T TAT GT T G G AGGCT T GAT G GAAAAAC CT AT T AAAC C AGT AC C AC AAGAC 913 

I I I I I II II I I I I II I I I I I I I I I I I I I I I I I II I I I I 

611 CCAAACGTTGATTTTGTTGGAGGATTCCACTGCAAACCTGCCAAACCCCTACCTAAGGAA 67 0 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



914 TTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGACCTTGGGCTCC 973 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

671 ATGGAGGAGTTTGTACAGAGCTCTGGAGAAAATGGTGTTGTGGTGTTTTCTCTGGGGTCA 730 

97 4 AT GGT GAAC AC CT GT C AGAAT CC G GAAAT CT T C AAGGAGAT GAACAAT GC CT TT GCT C AC 1033 

I I I I II II I I I I I I I I I II I I I I II I I 

731 GT GATAAGTAAC AT GACAGCAGAAAGGGCCAATGTAATT GCAACAGCCCTTGCCAGG 7 87 

1034 CT AC C C CAAGG G GT GAT AT GGAAGT GT C AGT GTT CT CAT T GGCC CAAAGAT GT C CAC CT G 1093 
I I I I I I I I I I I I I I I I I I I I III I II 

788 AT C C CAC AAAAGGTT CT GT GGA GAT T T GAC G G G AAT AAAC C AG AT G C C T T A 838 

1094 GCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCACCCAAGC 1153 

II III I I I II I I I I I I I I I I II I I I I I I I I I I I 

839 G GT CT C AAT ACT C GG CT GT AC AAGT G GAT AC C C C AGAAT GAC C T T C TAG GT CAT C CAAAA 8 98 

1154 AT CCGTCTGTTTGT CAC C CAC GGCGGG C AG AAT AG CAT AAT G GAG G C CAT C C AG CAT GGT 1213 

I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I 

899 AC CAGAGCTTTTATAACTCAT GGT GGAGC CAAT GGCAT CT AT GAGGCAAT CT AC CAT GGG 958 

1214 GT GCCCAT GGT GGGGAT CC CT CT CT TT GGAGACCAGCCT GAAAAC AT GGT C CGAGTAGAA 1273 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT C C C CAT GGT GGG CAT T C CAT TGTTTTTT GAT CAAC C T G AT AAC AT T G C T CAC AT G AAG 1018 



959 



1333 



1274 GCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGAGACATTGGCTCTT 

I I I I I I I I I I I I I I I I I I I II I 
1019 G C CAAGG GAGCAGCT GT T AGAT T G GAC T T CAACACAAT GT C GAGT AC AGAC C T GC T GAAT 1078 

1334 AAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT C C GC GGCAGT GGCT GCCAGT GT C 1393 

I I II I I I I I II I I I I I II 

1079 GCACT GAAGACAGTAAT TAAT GAT CCTTTATATAAAGAGAAT ATT AT GAAATT AT CAAGA 1138 

1394 ATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGGATTGACCACGTC 14 53 

II I I I I I I II III I I I II I I I I I I I I I Ml 
1139 AT T CAAC AT GAT CAAC C AGT AAAG C C C C T GGAT C GAGC AGT CT T C T GGAT T GAAT T T GT C 1198 

1454 CTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCAGCCCTGGCATGAG 1513 

II I I I I I I I I I I I I I I I I I I I I M 

119 9 AT GC C C CACAAAGGAGC CAAACAC CT T C GAGTT GCAGCCCAT GACCT CAC CT GGT TC CAG 1258 



Qy 1514 CAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGG 1547 

I II I I I I I I I M II I II I I I II I 
Db 12 59 TACCACTCTTTGGATGTGATTGGGTTTCTGCTGG 12 92 



RESULT 10 
PCT-US92-00282-1 

; Sequence 1, Application PC/TUS9200282 
/ GENERAL INFORMATION: 

APPLICANT: OWENS, IDA S. 

APPLICANT: RITTER, JOSEPH K. 

TITLE OF INVENTION: THE GENETIC LOCUS UGT1 AND A MUTATION 
; TITLE OF INVENTION: THEREIN. 

; NUMBER OF SEQUENCES: 4 0 
; CORRESPONDENCE ADDRESS: 

ADDRESSEE: CUSHMAN DARBY & CUSHMAN 
; STREET: 1615 L STREET, N.W. 

CITY: WASHINGTON 

STATE: D.C. 

COUNTRY: U.S.A. 

ZIP: 20036-5601 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: PCT/US92/002 82 
FILING DATE: 19920110 
CLASSIFICATION: 435 
ATTORNEY/AGENT INFORMATION: 
NAME: SCOTT, WATSON T. 
REGISTRATION NUMBER: 26581 
REFERENCE/DOCKET NUMBER: 91532-PCT 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 202-861-3000 
TELEFAX: 202-822-0944 
; TELEX: 6714627 CUSH 

; INFORMATION FOR SEQ ID NO: 1: 

SEQUENCE CHARACTERISTICS: 
; LENGTH: 2336 base pairs 

TYPE: NUCLEIC ACID 
STRANDEDNESS: single 
; TOPOLOGY: linear 

MOLECULE TYPE: cDNA 
PCT-US92-00282-1 

Query Match 5.1%; Score 118; DB 5; Length 2336; 

Best Local Similarity 47.6%; Pred. No. 1.2e-25; 

Matches 457; Conservative 0; Mismatches 485; Indels 18; Gaps 3 
Qy 599 CCAATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTC 658 

II I III II II II II II I INI I I II I I I I I I I I I I I 

Db 559 CCCAACCCATTCTCCTACGTGCCCAGGCCTCTCTCCTCTCATTCAGATCACATGACCTTC 618 



Qy 



659 T G G G G C C G AGT G AAG AAT T T T C T GAT G T T C T T T AGT T T C T G C AG GAG G C AAC AG C A C AT G 718 



Db 619 CTGCAGCGGGTGAAGAACATGCTCATTGCCTTTTCACAGAACTTTCTGTGCGACGTGGTT 67 8 

Qy 719 C AGT CT AC AT T T GAC AAC AC CAT CAAG GAAC AT T T C AC AGAAG GCT C T AGG C C AGT T T T G 77 8 

I I I I I I I I I I III I I I I II 

Db 679 TAT T C C C C GT AT G C AAC CCTTGCCT C AGAAT T C C T T C AG AGAG AGGTGACTGTC 732 

Qy 779 TCTCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTT 838 

I I I I I M I I I I I III MINIM I I I I 

Db 7 33 CAGGACCTATTGAGCTCTGCATCTGTCTGGCTGTTTAGAAGTGACTTTGTGAAGGATTAC 7 92 

Qy 839 GCTCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAA 898 

I I I I I I I I I I I I I I I I I I I I I I I I I II I II 

Db 793 CCTAGGCCCATCATGCCCAATATGGTTTTTGTTGGTGGAATCAACTGCCTTCACCAAAAT 852 

Qy 899 CCAGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTT 958 

I I I I I I II I I I I I I II II II I I I I I I III I I I I II 

Db 853 C C AC TAT C C CAGGAATT T GAAGC CT AC ATT AAT G CT T CT GGAGAACAT GGAAT T GT G GT T 912 

Qy 959 GT GACCTT GGGCT CCAT GGT GAACAC CT GT CAGAAT C C GGAAAT CTT CAAGGAGAT GAAC 1018 

I I I I I I I I I I I I I I II I III I I I II 

Db 913 TT CT CTT T GGGAT CAAT GGT CT CAGAAAT T C CAGA GAAGAAAGCTATGGCAATTGCT 969 

Qy 1019 AATGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCC 107 8 

I II I I I I I I I I I I I I I I I I I I III I 

Db 970 GAT GCTTTGGG C AAAAT C C C T C AG AC AG TCCTGTGGCGG T AC AC T G GAAC C C GAC CAT C G 102 9 

Qy 1079 AAAGAT GT C C AC CT G GCT GCAAAT GT GAAAAT T GT G GACT GGC TT C CT C AG AGT GAC C T C 1138 

I I II II II I I I I I I I I I I II I I I I I I II I I 

Db 1030 AAT CTT GC GAAC AAC AC GAT ACT T GT T AAGT GGCT AC C C CAAAAC GAT C T G 1080 

Qy 1139 CT GGCT CACCCAAGCAT C CGT CT GTT T GT CAC CCAC GGC GGGC AGAAT AGCAT AAT GGAG 1198 

II I I I I I I I I I I I I I I I I I II I II I I II II I I II 

Db 10 81 CTTGGTCACCCGATGACCCGTGCCTTTATCACCCATGCTGGTTCCCATGGTGTTTATGAA 114 0 

Qy 1199 GCCATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAAC 12 58 

III I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II 

Db 1141 AGCAT AT G CAAT G G C GT T C C CAT G GT GAT GAT GC CCT T GTT T GGT GAT C AGAT GGAC AAT 1200 

Qy 1259 ATGGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCA 1318 

I I I I I I I I I I I I I I I I I II II I 

Db 12 01 GCAAAGCGCATGGAGACTAAGGGAGCTGGAGTGACCCTGAATGTTCTGGAAATGACTTCT 12 60 

Qy 1319 GAGAC AT T G G C T CT T AAGAT GAAAC AAAT CAT GGAAGAC AAGAGAT AC AAGT C C GC G G C A 1378 

II Ml I I I I I Mill I I II I I I I I I I I I I 

Db 12 61 GAAGATTT AGAAAAT GCT CTAAAAGCAGT CAT CAAT GACAAAAGTT ACAAGGAGAACAT C 132 0 

Qy 137 9 GTGGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGC 14 3 8 

I I III I I I I I I I II I I I I I I I 

Db 1321 AGGCGCCTCTCCAGCCTTCACAAGGACCGCCCGGTGGAGCCGCTGGACCTGGCCGTGTTC 138 0 

Qy 1439 TGGATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAG 1498 

III I II II I I II I I I I I I I II M II I II I 

Db 1381 TGGGTGGAGTTTGTGATGAGGCACAAGGGCGCGCCACACCTGCGCCCCGCAGCCCACGAC 1440 

Qy 1499 CAGCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTG 1558 

I I I I I I I III I I I I I I I I Ml I I I I III M Ml 



Db 1441 CTCACCTGGTACCAGTACCATTCCTTGGACGTGATTGGTTTCCTCTTGGCCGTCGTGCTG 1500 



RESULT 11 
PCT-US92-00282-2 

; Sequence 2, Application PC/TUS9200282 
; GENERAL INFORMATION: 

APPLICANT: OWENS, IDA S. 

APPLICANT: RITTER, JOSEPH K. 

TITLE OF INVENTION: THE GENETIC LOCUS UGT1 AND A MUTATION 
; TITLE OF INVENTION: THEREIN. 

; NUMBER OF SEQUENCES: 4 0 

CORRESPONDENCE ADDRESS: 

ADDRESSEE: CUSHMAN DARBY & CUSHMAN 
STREET: 1615 L STREET, N.W. 
CITY: WASHINGTON 
STATE: D.C. 
; COUNTRY: U.S.A. 

ZIP: 20036-5601 
COMPUTER READABLE FORM: 
; MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 
; APPLICATION NUMBER: PCT/US92/ 002 82 

; FILING DATE: 19920110 

; CLASSIFICATION: 435 

; ATTORNEY/AGENT INFORMATION: 

; NAME: SCOTT, WATSON T. 

REGISTRATION NUMBER: 2 6581 
; REFERENCE/DOCKET NUMBER: 91532-PCT 

; TELECOMMUNICATION INFORMATION: 

TELEPHONE: 202-861-3000 

TELEFAX: 202-822-0944 

TELEX: 6714627 CUSH 
; INFORMATION FOR SEQ ID NO: 2: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 2339 base pairs 

TYPE: NUCLEIC ACID 

STRANDEDNESS: single 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
PCT-US92-00282-2 

Query Match 4.8%; Score 111.2; DB 5; Length 2339; 

Best Local Similarity 48.5%; Pred. No. 1.5e-23; 

Matches 376; Conservative 0; Mismatches 388; Indels 12; Gaps 2; 

Qy 783 ATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGCTC 8 42 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 740 ATCTTGTCAGCTATGCATCCGTGTGGCTGTTCCGAGGGGACTTTGTGATGGACTACCCCA 799 

Qy 843 GACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACCAG 902 

III I I I II I I II III MM III I I I I I I I 

Db 800 GGCCGATCATGCCCAACATGGTCTTCATTGGGGGCATCAACTGTGCCAACGGGAAGCCAC 8 59 



Qy 903 TACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGTGA 962 

I I I II I I I I I I I I I I I I I I I I I I III I I I I II I 

Db 860 TAT C T C AG GAAT T T G AAG C C T AC AT T AAT G C T T C T G G AG AAC AT G G AAT TGTGGTTTTCT 919 

Qy 963 CCTTGGGCTC CAT GGT GAAC AC C T GT C AGAAT C C G GAAAT CT T C AAGGAGAT GAAC AAT G 1022 

I I I I II I I II I I I II I I I I I I I I I I II 

Db 92 0 C T T T G G GAT C AAT G G T C T C AG AAAT T C C AG AG AAG AAAG C TAT GGCAATTGCTGATG 976 

Qy 1023 CCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAAAG 1082 

I I I I I I I I I I I I I I II I I III III 

Db 977 CT TT G G GCAAAAT C C CT C AGACAGT C C T GT GGC GGT AC ACT G GAAC CC GAC CAT CGAAT C 1036 

Qy 108 3 ATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGG 1142 

II II II I I I I I I I I I I I I I II I I I II I I I I I 

Db 1037 TTGCGAAC AACACGATACTTGTTAAGTGGCTACCCCAAAACGATCTGCTTG 108 7 

Qy 1143 C T C AC C C AAG CAT CCGTCTGTTTGT C AC C C AC G G C G G G C AG AAT AG CAT AAT G GAG G C C A 1202 

I I I II I I I I I II I II I I I I I I I I II II I I II II 

Db 1088 GTCACCCGATGACCCGTGCCTTTATCACCCATGCTGGTTCCCATGGTGTTTATGAAAGCA 1147 

Qy 1203 TCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATGG 12 62 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1148 TAT G CAAT GGCGTTCC CAT GGT GAT GAT GCCCTTGTTTGGT GAT C AGAT G GACAA.T GCAA 1207 

Qy 12 63 T C C GAGT AGAAG C C AAAAAGT T T GGT GT T T C TAT T CAGT T AAAG AAGC T C AAG GC AGAGA 1322 

I I I I I I I I II I II I I I I I I I I III 

Db 1208 AGCGCAT GGAGACTAAG G GAG CT G GAGT G AC CCT GAAT GT T CT GGAAAT GAC TT CT GAAG 1267 

Qy 1323 CATT GGCT CTTAAGAT GAAACAAAT CATGGAAGACAAGAGAT ACAAGT CCGC GGCAGT GG 1382 

III I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1268 AT T T AG AAAAT G CT CT AAAAG CAGT CAT CAAT GACAAAAGT T AC AAGGAGAAC AT C AG G C 1327 

Qy 1383 CTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGGA 1442 

I III I I I I I I I II III I I I I I I I 

Db 132 8 GCCTCTCCAGCCTTCACAAGGACCGCCCGGTGGAGCCGCTGGACCTGGCCGTGTTCTGGG 1387 

Qy 1443 TTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCAGC 1502 

III II I I I I I I I II I II I I I III II II 

Db 1388 T G GAGT T T GT GAT GAG GCACAAG GG CGC GC CAC AC CT GC GC C C C GC AG C C C AC GAC CT C A 1447 

Qy 1503 CCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTG 1558 

I I I I I I III I I I I I I I I III I I I I III I I I I I 

Db 14 4 8 CCTGGTACCAGTACCATTCCTTGGACGTGATTGGTTTCCTCTTGGCCGTCGTGCTG 1503 

RESULT 12 
US-09-305-856B-17 

; Sequence 17, Application US/09305856B 

; Patent No. 6479236 

; GENERAL INFORMATION: 

; APPLICANT: Penny, Laura 

; APPLICANT: Galvin, Margaret 

; TITLE OF INVENTION: Genotyping the Human 

; TITLE OF INVENTION: UDP-Glucuronosyltrans f erase 1 (UGT1) Gene 
; FILE REFERENCE: 4389-7 (formerly SEQ-17CIP) 
; CURRENT APPLICATION NUMBER: US/09/305, 856B 
; CURRENT FILING DATE: 1999-05-05 



PRIOR APPLICATION NUMBER: 60/084,807 
PRIOR FILING DATE: 1998-05-07 
NUMBER OF SEQ ID NOS : 124 

SOFTWARE : FastSEQ for Windows Version 3.0 
SEQ ID NO 17 
LENGTH: 735 
TYPE : DNA 

ORGANISM: Homo sapiens 
FEATURE : 
NAME/ KEY: CDS 
LOCATION: (1) . . . (735) 
US-09-305-856B-17 

Query Match 4.1%; Score 95.6; DB 4; Length 735; 

Best Local Similarity 50.2%; Pred. No. 4.5e-19; 

Matches 236; Conservative 0; Mismatches 234; Indels 0; Gaps 0; 

Qy 1089 ACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCACC 1148 

I I I I I II I I I I I I I I Mill M II I I I I I I I I I I I I I 

Db 167 AT CT T G C GAACAAC AC GAT ACTT GT T AAGT GGC TAC C C CAAAAC GAT CTGCTTGGT C AC C 22 6 

Qy 1149 C AAG CAT CCGTCTGTTTGT C AC C C AC G G C G G G C AG AAT AG C AT AAT G GAG G C CAT C C AG C 1208 

I I I I I I I I I I I II I I I I I II I I I I II III 

Db 227 C GAT GAC CCGTGCCTT TAT C AC C CAT GCTGGTTCC CAT G GT GT T TAT GAAAGC AT AT G C A 2 86 

Qy 1209 ATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATGGTCCGAG 12 68 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 287 AT GGC GT T C C CAT G GT GAT GAT GCCCTTGTTTGGT GAT CAGAT G GACAAT G C AAAGC GC A 34 6 

Qy 1269 T AGAAG C CAAAAAGT T T GGT GT T T C TAT T C AGT T AAAG AAGC T C AAG G C AGAGAC AT T G G 1328 

I I I I I I I I I I I I I I I I I I I III. Ill 

Db 347 T GGAGACT AAG G GAG CT GGAGT GAC C C T GAAT GT T CT G GAAAT GAC T T CT GAAGAT T TAG 406 

Qy 132 9 C T C T T AAGAT GAAAC AAAT CAT G GAAG AC AAG AGAT AC AAGT C C GC G G C AGT G G C T G C C A 1388 

I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 4 07 AAAAT GCT CTAAAAGCAGT CAT CAAT GACAAAAGTT ACAAGGAGAACAT CAT GC GCCT CT 4 66 

Qy 138 9 GTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTGGATTGACC 144 8 

III I I I I I I I II III I I I I I I I I I I 

Db 4 67 CCAGCCTTCACAAGGACCGCCCGGTGGAGCCGCTGGACCTGGCCGTGTTCTGGGTGGAGT 52 6 

Qy 1449 ACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCAGCCCTGGC 1508 

III I I I I I I I I I I I I I I III II II I I I I I 

Db 527 TTGTGATGAGGCACAAGGGCGCGCCACACCTGCGCCCCGCAGCCCACGACCTCACCTGGT 586 

Qy 1509 ATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTG 1558 

I I I I I I I I I I I I I I I I I I I I I I II III 

Db 58 7 ACCAGTACCATTCCTTGGACGTGATTGGTTTCCTCTTGGCCGTCGTGCTG 63 6 



RESULT 13 
US-08-232-463-14 

; Sequence 14, Application US/08232463 
; Patent No. 5670367 
; GENERAL INFORMATION: 

APPLICANT: DORNER, F. 

APPLICANT: SCHEIFLINGER, F. 



APPLICANT: FALKNER, F. G. 

TITLE OF INVENTION: RECOMBINANT FOWLPOX VIRUS 
; NUMBER OF SEQUENCES: 52 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Foley & Lardner 
; STREET: 1800 Diagonal Road, Suite 500 

; CITY: Alexandria 

STATE: VA 

COUNTRY: USA 

ZIP: 22313-0299 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
; COMPUTER: IBM PC compatible 

; OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
; CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 08/232 , 4 63 

FILING DATE: 
; CLASSIFICATION: 435 

PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/07/935, 313 

FILING DATE: 

APPLICATION NUMBER: EP 91 114 300.6 
FILING DATE: 2 6-AUG-1991 
ATTORNEY/AGENT INFORMATION: 
NAME: BENT, Stephen A. 
REGISTRATION NUMBER: 29,768 
REFERENCE/DOCKET NUMBER: 30472/114 IMMU 
TELECOMMUNICATION INFORMATION: 
; TELEPHONE: (703)836-9300 

TELEFAX: (703)683-4109 
TELEX: 899149 
; INFORMATION FOR SEQ ID NO: 14: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 7218 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: single 
TOPOLOGY: linear 
IMMEDIATE SOURCE: 
CLONE: pTZgpt-Fls 
US-08-232-463-14 



Query Match 3.4%; Score 79.2; DB 1; Length 7218; 

Best Local Similarity 8.3%; Pred. No. 2.7e-13; 

Matches 36; Conservative 235; Mismatches 163; Indels 0; Gaps 0; 

Qy 167 9 TGTCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTA 17 38 

III II I I II I I I I I I I I I : : : : : : :::::::::: ::::::: 
Db 104 0 TGGCTGCAGGTCGAGGGAGCTTGCGATYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1099 

Qy 1739 GTTATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGC 17 9 8 

Db 1100 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1159 



Qy 1799 TAATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTC 1858 

• «*•• * ... *•*•■ .. ..... ... • • • ••»»•»• . . 

• .*•• *• * ... ••*.. a. . . . * . ••• » «♦•»»■• . . 

Db 1160 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1219 



Qy 1859 CTCTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGA 1918 

Db 122 0 YYYY YYYYYYYYYYYYY YYYYYYYY YYYY YYYYYYYYYYYYYYYYYYYYYYY YYYYYYYY 12 7 9 



Qy 1919 CTTGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTC 19 7 8 

Db 1280 YYYY Y YY Y YYYYY Y YY Y YYYYYYYYYYYYY YYYYYYYY YYYY YYYYYY YYYY YYYYYYYY 1339 

Qy 1979 TCCGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACT 2 038 

Db 1340 YYYYY YYYYYY YYYY YYYYYYYY YYYYYYYY YY YYYYY YYYYYYYYYYYYYYYYYYYYYY 13 99 

Qy 2 039 C CT G C C CCT ACT AT CT AT C AT GGAAT AAC AT C C AAGAAAGAC AC CT T GC AT AT T CT T T C A 2 098 

:::::::::::::::: : : : : : | | | | | | Mill I 

Db 14 00 YYY YYYY YYYY YYYY Y YYYYY YYYY YYYY YYYY YYGT AC CAAATT CTT CT AT CT CT T TAA 1459 

Qy 2099 GTTTCTGTTTTGTT 2112 

I I I I I I 
Db 1460 CTACTTGCATAGAT 1473 



RESULT 14 

US-09-833-381-344/c 

Sequence 344, Application US/09833381 
Patent No. 6672186 
GENERAL INFORMATION: 
APPLICANT: Robison, Keith E. 

TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 
FILE REFERENCE: 58 0 0-119 

CURRENT APPLICATION NUMBER: US/09/ 833, 381 
CURRENT FILING DATE: 2001-04-11 
PRIOR APPLICATION NUMBER: 09/516,448 
PRIOR FILING DATE: 2000-02-29 
NUMBER OF SEQ ID NOS : 2050 

SOFTWARE: FastSEQ for Windows Version 3.0 
SEQ ID NO 344 
LENGTH: 588 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-833-381-344 

Query Match 3.2%; Score 74; DB 4; Length 588; 

Best Local Similarity 61.3%; Pred. No. 1.9e-12; 

Matches 119; Conservative 0; Mismatches 75; Indels 0; Gaps 0; 

Qy 1100 AATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCTGGCTCACCCAAGCATCCGT 1159 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 564 AAT AC GAGAGT GT AC AAGT GGCTCCCC C AGAAT G AC C T C C T T G GT CAT C C AAAAAG AAAA 505 

Qy 1160 CTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGCCATCCAGCATGGTGTGCCC 1219 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I III 

Db 504 GCCTTTGTAACTCATGGTGGGGCCAATGGTGTCTATGAGGTGATCTATCATGGAATCCCT 4 45 

Qy 1220 ATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACATGGTCCGAGTAGAAGCCAAA 1279 

I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I II MM: 
Db 444 AT GAT T G G C AT TCCTTTGTTTG G AGAAC AAC AT GAT AAT AT T G C C CAT AT G GT G G C C AAA 385 



Qy 12 8 0 AAGTTTGGTGTTTC 1293 

I I I I I I 

Db 384 GGAGCAGCTGTTAC 371 



RESULT 15 
US-09-356-806-5 

Sequence 5, Application US/09356806 
Patent No. 6586175 
GENERAL INFORMATION: 
APPLICANT: Penny, Laura 
APPLICANT: Galvin, Margaret 
APPLICANT: Miller, Andrew 
APPLICANT: Reidy, Michael 
TITLE OF INVENTION: Genotyping Human 

TITLE OF INVENTION: UDP-Glucuronosyltrans f erase 2B4 (UGT2B4 ) , 2B7 (UGT2B7) 
and 

TITLE OF INVENTION: 2B15 (UGT2B15) Genes 
FILE REFERENCE: SEQ-22PRV2 

CURRENT APPLICATION NUMBER: US/09/356, 8 06 
CURRENT FILING DATE: 1999-07-20 
NUMBER OF SEQ ID NOS : 164 

SOFTWARE: FastSEQ for Windows Version 3.0 
SEQ ID NO 5 
LENGTH: 68 9 
TYPE: DNA 

ORGANISM: H. sapiens 
FEATURE: 
NAME/ KEY: Other 
LOCATION: (123) . . . (342) 
US-09-356-806-5 

Query Match 2.8%; Score 63.8; DB 4; Length 68 9; 

Best Local Similarity 60.8%; Pred. No. 3e-09; 

Matches 104; Conservative 0; Mismatches 67; Indels 0; Gaps 0; 

Qy 1137 TCCTGGCT C AC C CAAGC AT C C GT C T GT T T GT CAC CCAC GGC GGG C AGAAT AGC AT AAT G G 1196 

I I I I 1 I I I I I I I I III I II I I I I I I I I I I I I I I I I I 

Db 117 TCCTAGGTCACCCAAAAACCAGAGCTTTTATAACTCATGGTGGAGCCAATGGCATCTATG 17 6 

Qy 1197 AGGCCATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAA 1256 

II I I II I I I I I I I I I I I I I I I II I III I I I I I I I I I I I I I I I I 

Db 177 AGGCAATCTACCATGGAATCCCTATGGTGGGCGTTCCATTGTTTGCAGATCAACCTGATA 2 36 

Qy 1257 AC AT G GT C C GAGT AGAAGC CAAAAAGT TTGGTGTT T CT AT T C AGT T AAAGA 1307 

I I I I I I I I I I I I I I I I I I II III II 

Db 237 AC AT T G CAC AC AT G AAG G C C AAG G GAG C AG C T G T TAG T T T G G AC T T C CAC A 287 



Search completed: May 16, 2004, 14:05:18 
Job time : 194 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on : 



May 16, 2004, 07:14:19 ; Search time 1397 Seconds 

(without alignments) 
7536.345 Million cell updates/sec 



Title: US-10-017-8 67A-281 

Perfect score: 2320 

Sequence: 1 agggtcccttagccgggcgc tctctccccaacctcactaa 2320 



Scoring table: 



IDENTITY__NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 2947324 seqs, 2269024515 residues 

Total number of hits satisfying chosen parameters: 



5894648 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database : Published_Applications_NA: * 

1: /cgn2_6/ptodata/l/pubpna/US07_PUBCOMB.seq:* 

2: /cgn2_6/ptodata/l/pubpna/PCT_NEW_PUB.seq:^ 

3: /cgn2_6/ptodata/l/pubpna/US06_NEW_PUB.seq:^ 

4 : /cgn2_6/ptodata/l/pubpna/US06_PUBCOMB . seq: * 

5 : /cgn2_6/ptodata/l/pubpna/US07_NEW_PUB . seq: * 

6: /cgn2_6/ptodata/l/pubpna/PCTUS_PUBCOMB.seq:* 

7 : /cgn2_6/ptodata/l/pubpna/US08_NEW_PUB . seq: * 

8 : /cgn2_6/ptodata/l/pubpna/US08_PUBCOMB. seq: * 

9: /cgn2_6/ptodata/l/pubpna/US09A_PUBCOMB.seq: * 

10: /cgn2_6/ptodata/l/pubpna/US09B_PUBCOMB.seq:* 

11: /cgn2_6/ptodata/l/pubpna/US09C_PUBCOMB.seq:* 

12 : /cgn2_6/ptodata/l/pubpna/US09_NEW_PUB. seq: * 

13 : / cgn2 j5/ptodata/ l/pubpna/US09_NEW_PUB . seq2 : * 

14 : /cgn2_6/ptodata/l/pubpna/US10A_PUBCOMB. seq: * 

15: /cgn2j5/ptodata/l/pubpna/US10B_PUBCOMB.seq:* 

16: /cgn2_6/ptodata/l/pubpna/USl0C_PUBCOMB.seq:* 

17 : /cgn2_6/ptodata/l/pubpna/US10_NEW_PUB.seq: + 

18 : /cgn2_6/ptodata/l/pubpna/US60_NEW_PUB. seq: * 

19: /cgn2_6/ptodata/l/pubpna/US60_PUBCOMB.seq:* 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 

% 

Result Query 



No. Score Match Length DB ID 



Description 
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100. 


0 


2320 


10 


US- 


09- 


946- 


374-281 


Sequence 


281, 


App 


2 


2320 


100. 


0 


2320 
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10- 


015- 


395A- 


281 


Sequence 


281, 


App 
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10- 


006- 


4 85A- 


281 


Sequence 


281, 


App 
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013- 
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Sequence 


281, 
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4 99A- 
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Sequence 


281, 
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0 


2320 


13 
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10- 
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2 54A- 


281 


Sequence 


281, 


App 


7 


2320 


100. 


0 


2320 


15 


us- 


10- 


006- 


856A- 


281 


Sequence 


281, 


App 
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2320 


100. 


0 


2320 


15 


us- 


10- 


006- 


818A- 


281 


Sequence 


281, 


App 
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2320 


100. 


0 


2320 


15 
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10- 


015- 


393A- 


281 


Sequence 


281, 


App 


10 


2320 


100. 


0 


2320 


15 


us- 


10- 


015- 


8 69A- 


281 


Sequence 


281, 


App 


11 


2320 


100.0 


2320 


15 


us- 


10- 


012- 


121A- 


281 


Sequence 


281, 


App 


12 


2320 


100. 


0 


2320 


15 


us- 


10- 


006- 


116A- 


281 


Sequence 


281, 


App 


13 


2320 


100. 


0 


2320 


15 


us- 


10- 


006- 


117A- 


281 


Sequence 


281, 


App 


14 


2320 


100. 


0 


2320 


15 


us- 


10- 


017- 


527A- 


■281 


Sequence 


281, 


App 


15 


2320 


100. 


0 


2320 


15 


us- 


10- 


013- 


913A- 


281 


Sequence 


281, 


App 


16 


2320 


100. 


0 


2320 


15 


us- 


10- 


007- 


194A- 


281 


Sequence 


281, 


App 


17 


2320 


100. 


0 


2320 


15 
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10- 


013- 


430A- 


■281 


Sequence 


281, 


App 
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100. 


0 


2320 


15 


us- 


10- 


011- 


671A- 


■281 


Sequence 


281, 


App 


19 


2320 


100. 


0 


2320 


15 


us- 


10- 


012- 


755A- 


•281 


Sequence 


281, 


App 


20 


2320 


100. 
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2320 


15 


us- 


10- 


015- 


38 6A- 


■281 


Sequence 


281, 


App 
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2320 


100. 


0 


2320 


15 


us- 


10- 


011- 


692A- 


-281 


Sequence 


281, 


App 


22 


2320 


100. 


0 


2320 


15 


us- 


10- 


006- 


768A- 


•281 


Sequence 


281, 


App 


23 


2320 


100. 


0 


2320 


15 


us- 


10- 


017- 


610A- 


■281 


Sequence 


281, 


App 


24 


2320 


100. 


0 


2320 


15 


us- 


10- 


006- 


0 63A- 


•281 


Sequence 


281, 


App 


25 


2320 


100. 


0 


2320 


15 


us- 


10- 


020- 


063A- 


■281 


Sequence 


281, 


App 


26 


2320 


100. 


0 


2320 


15 


us- 


10- 


015- 


•391A- 


-281 


Sequence 


281, 


App 


27 


2320 


100. 


0 


2320 


15 


us- 


10- 


017- 


4 07A- 


■281 


Sequence 


281, 


App 


28 


2320 


100. 


0 


2320 


15 


us- 


10- 


011- 


833A- 


-281 


Sequence 


281, 


App 


29 


2320 


100. 


0 


2320 


15 


us- 


10- 


006- 


•041A- 


-281 


Sequence 


281, 


App 


30 


2320 


100. 


0 


2320 


15 


us- 


•10- 


015- 


822A- 


•281 


Sequence 


281, 


App 


31 


2320 


100. 


0 


2320 


15 


us- 


■10- 


•015- 


387A- 


•281 


Sequence 


281, 


App 


32 


2320 


100. 


0 


2320 


15 


us- 


•10- 


006- 


■130A- 


■281 


Sequence 


281, 


App 


33 


2320 


100. 


0 


2320 


15 


us- 


•10- 


•006- 


•172A- 


■281 


Sequence 


281, 


App 


34 


2320 


100. 


0 


2320 


15 


us- 


■10- 


•017- 


■253A- 


•281 


Sequence 


281, 


App 


35 


2320 


100. 


0 


2320 


15 


us- 


•10- 


•015- 


•392A- 


-281 


Sequence 


281, 


App 


36 


2320 


100. 


0 


2320 


15 


us- 


•10- 


•017- 


•306A- 


-281 


Sequence 


281, 


App 


37 


2320 


100. 


0 


2320 


15 


us- 


■10- 


•017- 


•867A- 


-281 


Sequence 


281, 


App 


38 


2320 


100. 


0 


2320 


15 


us- 


■10- 


•012- 


■064A- 


-281 


Sequence 


281, 


App 


39 
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100. 
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2320 


15 


us- 


•10- 


-013- 


•909A- 


-281 


Sequence 


281, 


App 


40 


2320 
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2320 


15 


us- 


-10- 


•015- 


■671A- 


-281 


Sequence 


281, 


App 


41 


2320 


100. 


0 


2320 


15 


us- 


■10- 


■015- 


•610A- 


-281 


Sequence 


281, 


App 


42 


2320 


100. 


0 


2320 


15 


us- 


■10- 


■012- 


■137A- 


-281 


Sequence 


281, 


App 
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2320 


100. 


0 


2320 


15 


us- 


■10- 


-012- 


•752A- 


-281 


Sequence 


281, 


App 


44 


2320 


100. 


0 


2320 


15 


us- 


■10- 


-012- 


-754A- 


-281 


Sequence 


281, 


App 


45 
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100. 
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2320 


15 


us- 


■10- 


-013- 


■910A- 


-281 


Sequence 


281, 


App 



ALIGNMENTS 



RESULT 1 

US-09-946-374-281 

; Sequence 281, Application US/09946374 
; Publication No. US20030073129A1 
; GENERAL INFORMATION: 



APPLICANT: Baker, Kevin P. 
APPLICANT: Botstein, David 
APPLICANT: Desnoyers, Luc 
APPLICANT: Eaton, Dan L. 
APPLICANT: Ferrara, Napoleone 
APPLICANT: Fong, Sherman 
APPLICANT: Gao, Wei-Qiang 
APPLICANT: Goddard, Audrey 
APPLICANT: Godowski, Paul J. 
APPLICANT: Grimaldi, Christopher J. 
APPLICANT: Gurney, Austin L. 
APPLICANT: Hillan, Kenneth J. 
APPLICANT: Pan, James 
APPLICANT: Paoni, Nicholas F. 
APPLICANT: Roy, Margaret Ann 
APPLICANT: Smith, Victoria 
APPLICANT: Stewart, Timothy A. 
APPLICANT: Tumas, Daniel 
APPLICANT: Watanabe, Colin K. 
APPLICANT: Williams, P. Mickey 
APPLICANT: Wood, William I. 

TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 
TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2830P1C1 

CURRENT APPLICATION NUMBER: US/09/94 6,374 
CURRENT FILING DATE: 2001-09-04 
PRIOR APPLICATION NUMBER: 60/098716 
PRIOR FILING DATE: 1998-09-01 
PRIOR APPLICATION NUMBER: 60/098723 
PRIOR FILING DATE: 1998-09-01 
PRIOR APPLICATION NUMBER: 60/098749 
PRIOR FILING DATE: 1998-09-01 
PRIOR APPLICATION NUMBER: 60/098750 
PRIOR FILING DATE: 1998-09-01 
PRIOR APPLICATION NUMBER: 60/098803 
PRIOR FILING DATE: 1998-09-02 
PRIOR APPLICATION NUMBER: 60/098821 
PRIOR FILING DATE: 1998-09-02 
PRIOR APPLICATION NUMBER: 60/098843 
PRIOR FILING DATE: 1998-09-02 
PRIOR APPLICATION NUMBER: 60/099536 
PRIOR FILING DATE: 1998-09-09 
PRIOR APPLICATION NUMBER: 60/099596 
PRIOR FILING DATE: 1998-09-09 
PRIOR APPLICATION NUMBER: 60/099598 
PRIOR FILING DATE: 1998-09-09 
PRIOR APPLICATION NUMBER: 60/099602 
PRIOR FILING DATE: 1998-09-09 
PRIOR APPLICATION NUMBER: 60/099642 
PRIOR FILING DATE: 1998-09-09 
PRIOR APPLICATION NUMBER: 60/099741 
PRIOR FILING DATE: 1998-09-10 
PRIOR APPLICATION NUMBER: 60/099754 
PRIOR FILING DATE: 1998-09-10 
PRIOR APPLICATION NUMBER: 60/099763 
PRIOR FILING DATE: 1998-09-10 
PRIOR APPLICATION NUMBER: 60/099792 



PRIOR FILING DATE: 1998-09-10 
PRIOR APPLICATION NUMBER: 60/099808 
PRIOR FILING DATE: 1998-09-10 
PRIOR APPLICATION NUMBER: 60/099812 
PRIOR FILING DATE: 1998-09-10 
PRIOR APPLICATION NUMBER: 60/099815 
PRIOR FILING DATE: 1998-09-10 
PRIOR APPLICATION NUMBER: 60/099816 
PRIOR FILING DATE: 1998-09-10 
PRIOR APPLICATION NUMBER: 60/100385 
PRIOR FILING DATE: 1998-09-15 
PRIOR APPLICATION NUMBER: 60/100388 
PRIOR FILING DATE: 1998-09-15 
PRIOR APPLICATION NUMBER: 60/100390 
PRIOR FILING DATE: 1998-09-15 
PRIOR APPLICATION NUMBER: 60/100584 
PRIOR FILING DATE: 1998-09-16 
PRIOR APPLICATION NUMBER: 60/100627 
PRIOR FILING DATE: 1998-09-16 
PRIOR APPLICATION NUMBER: 60/100661 
PRIOR FILING DATE: 1998-09-16 
PRIOR APPLICATION NUMBER: 60/100662 
PRIOR FILING DATE: 1998-09-16 
PRIOR APPLICATION NUMBER: 60/100664 
PRIOR FILING DATE: 1998-09-16 
PRIOR APPLICATION NUMBER: 60/100683 
PRIOR FILING DATE: 1998-09-17 
PRIOR APPLICATION NUMBER: 60/100684 
PRIOR FILING DATE: 1998-09-17 
PRIOR APPLICATION NUMBER: 60/100710 
PRIOR FILING DATE: 1998-09-17 
PRIOR APPLICATION NUMBER: 60/100711 
PRIOR FILING DATE: 1998-09-17 
PRIOR APPLICATION NUMBER: 60/100848 
PRIOR FILING DATE: 1998-09-18 
PRIOR APPLICATION NUMBER: 60/100849 
PRIOR FILING DATE: 1998-09-18 
PRIOR APPLICATION NUMBER: 60/100919 
PRIOR FILING DATE: 1998-09-17 
PRIOR APPLICATION NUMBER: 60/100930 
PRIOR FILING DATE: 1998-09-17 
PRIOR APPLICATION NUMBER: 60/101014 
PRIOR FILING DATE: 1998-09-18 
PRIOR APPLICATION NUMBER: 60/101068 
PRIOR FILING DATE: 1998-09-18 
PRIOR APPLICATION NUMBER: 60/101071 
PRIOR FILING DATE: 1998-09-18 
PRIOR APPLICATION NUMBER: 60/101279 
PRIOR FILING DATE: 1998-09-22 
PRIOR APPLICATION NUMBER: 60/101471 
PRIOR FILING DATE: 1998-09-23 
PRIOR APPLICATION NUMBER: 60/101472 
PRIOR FILING DATE: 1998-09-23 
PRIOR APPLICATION NUMBER: 60/101474 
PRIOR FILING DATE: 1998-09-23 
PRIOR APPLICATION NUMBER: 60/101475 
PRIOR FILING DATE: 1998-09-23 



PRIOR APPLICATION NUMBER: 60/101476 
PRIOR FILING DATE: 1998-09-23 
PRIOR APPLICATION NUMBER: 60/101477 
PRIOR FILING DATE: 1998-09-23 
PRIOR APPLICATION NUMBER: 60/101479 
PRIOR FILING DATE: 1998-09-23 
PRIOR APPLICATION NUMBER: 60/101738 
PRIOR FILING DATE: 1998-09-24 
PRIOR APPLICATION NUMBER: 60/101741 
PRIOR FILING DATE: 1998-09-24 
PRIOR APPLICATION NUMBER: 60/101743 
PRIOR FILING DATE: 1998-09-24 
PRIOR APPLICATION NUMBER: 60/101915 
PRIOR FILING DATE: 1998-09-24 
PRIOR APPLICATION NUMBER: 60/101916 
PRIOR FILING DATE: 1998-09-24 
PRIOR APPLICATION NUMBER: 60/102207 
PRIOR FILING DATE: 1998-09-29 
PRIOR APPLICATION NUMBER: 60/102240 
PRIOR FILING DATE: 1998-09-29 
PRIOR APPLICATION NUMBER: 60/102307 
PRIOR FILING DATE: 1998-09-29 
PRIOR APPLICATION NUMBER: 60/102330 
PRIOR FILING DATE: 1998-09-29 
PRIOR APPLICATION NUMBER: 60/102331 
PRIOR FILING DATE: 1998-09-29 
PRIOR APPLICATION NUMBER: 60/102484 
PRIOR FILING DATE: 1998-09-30 
PRIOR APPLICATION NUMBER: 60/102487 
PRIOR FILING DATE: 1998-09-30 
PRIOR APPLICATION NUMBER: 60/102570 
PRIOR FILING DATE: 1998-09-30 
PRIOR APPLICATION NUMBER: 60/102571 
PRIOR FILING DATE: 1998-09-30 
PRIOR APPLICATION NUMBER: 60/102684 
PRIOR FILING DATE: 1998-10-01 
PRIOR APPLICATION NUMBER: 60/102687 
PRIOR FILING DATE: 1998-10-01 
PRIOR APPLICATION NUMBER: 60/102965 
PRIOR FILING DATE: 1998-10-02 
PRIOR APPLICATION NUMBER: 60/103258 
PRIOR FILING DATE: 1998-10-06 
PRIOR APPLICATION NUMBER: 60/103314 
PRIOR FILING DATE: 1998-10-07 
PRIOR APPLICATION NUMBER: 60/103315 
PRIOR FILING DATE: 1998-10-07 
PRIOR APPLICATION NUMBER: 60/103328 
PRIOR FILING DATE: 1998-10-07 
PRIOR APPLICATION NUMBER: 60/103395 
PRIOR FILING DATE: 1998-10-07 
PRIOR APPLICATION NUMBER: 60/103396 
PRIOR FILING DATE: 1998-10-07 
PRIOR APPLICATION NUMBER: 60/103401 
PRIOR FILING DATE: 1998-10-07 
PRIOR APPLICATION NUMBER: 60/103449 
PRIOR FILING DATE: 1998-10-06 
PRIOR APPLICATION NUMBER: 60/103633 



PRIOR FILING DATE: 1998-10-08 
PRIOR APPLICATION NUMBER: 60/103678 
PRIOR FILING DATE: 1998-10-08 
PRIOR APPLICATION NUMBER: 60/103679 
PRIOR FILING DATE: 1998-10-08 
PRIOR APPLICATION NUMBER: 60/103711 
PRIOR FILING DATE: 1998-10-08 
PRIOR APPLICATION NUMBER: 60/104257 
PRIOR FILING DATE: 1998-10-14 
PRIOR APPLICATION NUMBER: 60/104987 
PRIOR FILING DATE: 1998-10-20 
PRIOR APPLICATION NUMBER: 60/105000 
PRIOR FILING DATE: 1998-10-20 
PRIOR APPLICATION NUMBER: 60/105002 
PRIOR FILING DATE: 1998-10-20 
PRIOR APPLICATION NUMBER: 60/105104 
PRIOR FILING DATE: 1998-10-21 
PRIOR APPLICATION NUMBER: 60/105169 
PRIOR FILING DATE: 1998-10-22 
PRIOR APPLICATION NUMBER: 60/105266 
PRIOR FILING DATE: 1998-10-22 
PRIOR APPLICATION NUMBER: 60/105693 
PRIOR FILING DATE: 1998-10-26 
PRIOR APPLICATION NUMBER: 60/105694 
PRIOR FILING DATE: 1998-10-26 
PRIOR APPLICATION NUMBER: 60/105807 

Query Match 100.0%; Score 2320; DB 10; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

I I I I I I I I I II I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I M I I I I II II I I 

Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

Qy 121 G CT C T C AG AG G CT G C C AAAAT C CT GAC AAT AT C T AC AGT AGGT G GAAG C CAT TAT C T AC T 18 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I II I I I I I I I I I I II I I I I I I I I I I I I 
Db 121 GCT CTCAGAGGCTGC CAAAAT CCT GACAATAT CTACAGTAGGT GGAAGC CAT TAT CTACT 18 0 

Qy 181 GAT G GAC CGGGTTTCT C AG AT T C T T C AAGAT C AC G G T CAT AAT GT C AC CAT GCT T AAC C A 240 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 181 GAT G GAC CGGGTTTCT C AG AT T CT T C AAGAT C AC GGT CAT AAT GT C AC CAT GCT T AAC C A 240 

Qy 241 CAAAAGAGGT C CTT TTAT GC CAGATT T T AAAAAGGAAGAAAAAT CAT AT CAAGTT AT C AG 300 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 241 CAAAAGAGGT CCTTT TAT GCCAGAT TT TAAAAAGGAAGAAAAAT CAT AT CAAGT TAT C AG 300 

Qy 301 TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 3 60 

I I I I I I I II I I I I I I I I I I I I I I I II I II II I I I I I II I I I I I I I I M I I I I I I I I I I I I 
Db 301 TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 



Qy 



361 AGAAACTT TAGGT GGCAGAGGAAAAT T T GAAAACTTAT TAAAT GT TCT AGAAT ACT T GGC 42 0 

II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 



Db 



361 AGAAACTTTAGGT GGCAGAGGAAAATTT GAAAACTTATTAAAT GT T CTAGAATACTT GGC 420 



Qy 421 GT T GCAGT GCAGT CAT TTTTTAAAT AGAAAGGATAT CAT GGATT CCTTAAAGAAT GAGAA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II II I II I II I I I I I I I I I I I I I I I I I I I 
Db 421 GT T GCAGT GCAGT CAT TTTTTAAAT AGAAAGGATAT CAT GGATT CCT TAAAGAAT GAGAA 480 

Qy 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 661 GGG C C G AGT GAAGAAT T T T C T GAT G T T C T T T AGT T T C T G C AG GAG G C AAC AG C AC AT G C A 72 0 

Qy 721 GT C T AC AT T T GAC AACAC CAT C AAG GAACAT T T C AC AG AAG G CT CT AGG C C AGT T T T GT C 7 80 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GT CT AC ATT T GAC AAC AC CAT CAAGGAACATT TCACAGAAGGCT CTAGGC CAGTT T T GT C 7 80 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I 
Db 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

Qy 961 GAC CTT GGGC T CC AT GGT GAACAC CT GT CAGAAT C C G GAAAT C T T CAAG GAGAT GAAC AA 1020 

I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I 
Db 961 GAC CT T GGGCT C CAT GGT GAAC AC CT GT CAGAAT CC G GAAAT CTT CAAG GAGAT GAAC AA 1020 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I II I I I I I I I I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

Qy 10 81 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

Qy 1141 G G C T C AC C CAAG CAT C C GT CT GT T T GT C AC C C AC GGC G GGC AG AATAGC AT AAT GG AG G C 1200 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I 
Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

Qy 12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

I II M I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 
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GGT C C GAGT AGAAGC CAAAAAGT TT GGT GTTT CTAT T CAGTTAAAGAAGCT CAAGGCAGA 132 0 

| | | | | | M | | | | | I I I I I I I I I I I I I I I I I I I I I I ill I I I I I I I I I I I I I I I I I I I I II I 

GGT C C G AGT AG AAGC C AAAAAGT TTGGTGTTTC TAT T C AGT T AAAGAAG C T C AAG G C AGA 132 0 

GACAT T GGCT CT T AAGAT GAAAC AAAT CAT GGAAGAC AAGAGAT ACAAGT C C G C G GC AGT 138 0 
M | | | M | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GACAT T GGC T CT T AAGAT GAAAC AAAT CAT GGAAGACAAGAGAT AC AAGT C C GC G G C AGT 138 0 

GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 15 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

| | | | || | | I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I M I 

GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

I I I I I I I I I I I I I I I I II I I II II I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I 

GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I 

AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 4 0 

| | | | | | | | | | | | | I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

I | | | I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

TAT CT C CT GT T T T CT T GAAGAAC AGGAAAAAT GGC CAAAAAT CAT C CT T T C C ACT T GC T A 1800 

ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

| | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

I M I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

CTTGTCCTCCTTT GTTT GCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCT GAGT GACT 192 0 

TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 19 8 0 

| | | | | | I I I I I I I I I I I I I I I I I I I I II I II I I I I II I I II I I I I I I I I I I I I I I M I I I 

TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

T G C C C C T AC TAT C TAT CAT G GAAT AAC AT C C AAGAAAG AC AC C T T G CAT AT T C T T T C AG T 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I M I I I I I I I I I 

T G C C C C TACT AT C TAT CAT G GAAT AAC AT C C AAGAAAGAC AC CT T G CAT ATT CT T T C AGT 2100 



Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

M | | | I | I | M I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I II I I I I I I I I I M 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

| | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 228 0 

| | I I I I I I M I II I I I I I I I I I I I I I II I I I I I I I I I II I I I I II I I I I I I I I I II I II I 
Db 2221 C AGT GAGCT C CT T C TT G G CT GAG C AGGC AT GGAGACT GT AGGT T T C C AGAT T T C C T GAAA 2280 

Qy 22 81 AATAAAAGTTTACAGCGTTAT CT CT CCCCAACCT CACTAA 2320 

I | I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22 81 AAT AAAAGT T T AC AG C GT TAT CT C T C C C C AAC C T CACTAA 232 0 
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Query Match 100.0%; Score 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 2320; Conservative 0; Mismatches 



DB 12; Length 2320; 

0; Indels 0; Gaps 



0; 



Qy 

Db 



1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I I I I II I I I I I I II I I I I I M I I I I I I I M I I I I I I I I I M I I I I I I I I I I 
1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 



Qy 


61 


Db 


61 


Qy 


121 


Db 


121 


Qy 


181 


Db 


181 


Qy 


241 


Db 


241 


Qy 


301 


Db 


301 


Qy 


361 


Db 


361 


Qy 


421 


Db 


421 


Qy 


481 


Db 


481 


Qy 


541 


Db 


541 


Qy 


601 


Db 


601 


Qy 


661 


Db 


661 


Qy 


721 


Db 


721 


Qy 


781 


Db 


781 


Qy 


841 


Db 


841 


Qy 


901 



AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

I M I I II I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I M I M I I I M I I I I I I I I I 
AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

GC T C T C AGAG G C T G C CAAAAT CCT GACAAT AT CT AC AGT AGGT GGAAGC CAT TAT C T ACT 18 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I II I I I 

G C T CT C AGAG G CT G C CAAAAT CCT GACAAT AT CT AC AGT AGGT GGAAG C CAT TAT C TACT 180 

GAT G GAC CGGGTTTCT C AG AT T C T T C AAGAT C AC GG T C AT AAT GT C AC CAT G CT T AAC C A 24 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAT G GAC CGGGTTTCT C AGAT T CT T CAAGAT C AC GGT CAT AAT GT C AC CAT GCT T AAC CA 240 

C AAAAG AG G T C C T T T TAT G C C AG AT T T T AAAAAG G AAG AAAAAT CAT AT C AAG T TAT C AG 3 00 

M | | I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C AAAAGAGGT C CT T T TAT G C C AGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 300 
TTGGCTTG C AC C T GAAG AT CAT C AAAG AG AAT T T AAAAAG AG T T T T GAT TTCTTTCTG GA 360 

I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I II I 

TTGGCTTG C AC C T GAAG AT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG GA 360 
AGAAACTT T AGGT GG CAGAGGAAAAT T T GAAAAC TT AT T AAAT GT T CTAGAAT ACT T GGC 420 

I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I 

AGAAACT T T AGGT G G CAGAGGAAAAT T T GAAAACTT AT T AAAT GT T C T AGAAT ACT T GGC 42 0 

GT T GC AGT GC AGT CAT T T T T T AAAT AGAAAGG AT AT CAT G GAT T C CT T AAAGAAT GAGAA 480 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

GT T G C AGT G C AG T CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT GAGAA 4 80 

CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I M I I I I I II I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I II 

CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 
TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II II I I I I I I I I I I M I I I I I I I I 

TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

| | | | | | | | | I I I I I II II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

| | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

GGGCCGAGTGAAGAATTTTCTGAT GTT CTTTAGTTT CT GCAGGAGGCAACAGCACAT GCA 720 

GT CT AC AT TT GACAAC AC CAT CAAG GAACAT T T CAC AGAAG G C T C T AG GC C AGT T T T GT C 7 80 

I | | | | I I I I I I II I I I I II I I I I I I I M I I I I II I II I I M II I I I I I I I I I I I I I I I I I 

GTCTACATTTGACAACACCATCAAGGAACATTTCACAGAAGGCTCTAGGCCAGTTTTGTC 7 8 0 
TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 8 4 0 

| | | I M I I I I I I I I II I I I I I I I I I I II I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I 

TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 
TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I | | | | | | | I I I I I I II I I I II I M I I I I I I M I I I I I I I I I II I I I I I I I M I I I I I I I I 

TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 
AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 



Db 
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Db 
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viy 
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Db 
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1141 


uy 
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uy 
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yy 
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nb 
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uy 
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1381 


yy 
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1441 


uy 
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C\\7 

wy 


1 Sfil 
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Db 


1561 


Ov 

wy 


1621 


Db 


1621 


Qy 


1681 


Db 


1681 


Qy 


1741 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 II II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I 

AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

GAC CTTGGGCTC CAT G GT GAAC AC CT GT C AGAAT C C G GAAAT CT T C AAG G AGAT GAAC AA 102 0 

I I I I I I I I I I I I I II I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAC CTTGGGCTC CAT G GT GAAC AC C T GT C AG AAT C C G GAAAT C T T C AAG GAG AT GAAC AA 102 0 

TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I M M | I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I 
TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 120 0 

I I I I I I I I I I I I I I I I II I I I I II I II I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

GGCT CAC C CAAGC AT CC GT CT GT T T GT C AC C C AC GGC G G GC AGAAT AGC AT AAT GGAG GC 120 0 

CAT C CAGCAT GGT GT GCCCAT GGT GGGGAT C C CT CT CT TT GGAGAC CAGC CT GAAAAC AT 12 60 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I 

CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

G GT C C GAGT AGAAGC C AAAAAGT T T G GT GT TT CT AT T CAGT T AAAGAAGC T CAAG G C AGA 132 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 

GGT C C GAGT AGAAG C CAAAAAGT T T GGT GT TT CT AT T CAGT T AAAGAAGC T CAAGG C AGA 132 0 

GACATT GGCT CTTAAGATGAAACAAAT CAT GGAAGACAAGAGAT ACAAGT CC GCGGCAGT 138 0 

I I I I II I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

GAC AT T G G C T C T T AAG AT GAAAC AAAT CAT G GAAGAC AAG AG AT AC AAG T C C G C G G CAGT 1380 

GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 
GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 15 0 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I 

GAT T GAC CAC GT C C T C C AGAC AG G GG G C GC GAC GC AC CT CAAGC C CT AT GT CT T T CAGC A 1500 

GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

| | | | | | | | | | | I II I I I I I I II I I I II I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 4 0 

TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 0 0 
| | | | | | | I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I M I 



Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I I I I I I I I I I I I II I I I I I I I II I I I I II I I I I I I II II I I I I I I I I I I I I II I I I M I 
Db 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

I || I II I I I I I II I II I I I I I I I I I I 1 I I I I I I II I II I I I I I I I I I I I I I I I I I II I I I 
Db 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

I II I I I I I I I I I I I I I I II I I I I I II I I I I I 1 I I I I I I I I I I I I I I I I I I II I I II I I I I 
Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

Qy 1981 CGT^TCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I 

Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

Qy 2 041 T GCCCCT ACT AT CTAT CAT GGAAT AACAT CCAAGAAAGACAC CTT GCAT ATT CTT T C AGT 2100 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2041 T GC C C CT AC TAT CTAT CAT G GAAT AACAT C CAAGAAAG AC AC CT T GCAT AT T C T T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I M I I I I I 

Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

Qy 2221 CAGT GAG CTCCTTCTTGGCT GAG C AGG CAT GGAGACT GT AGGT T T C C AGAT TT C C T GAAA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I 
Db 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

Qy 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 

I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 2281 AAT AAAAGT T T AC AG C GT TAT C T C T C C C C AAC C T C AC T AA 2320 
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Query Match 100.0%; Score 2320; DB 13; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

I I I I I I I I I II I II I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 
Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

Qy 121 GCT CT CAGAGGCT GC CAAAAT CCT GACAAT AT CTAC AGTAGGTGGAAGCCATTAT CT ACT 180 

I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 121 GCT CT CAGAGGCT GC CAAAAT CCT GACAAT AT CTACAGTAGGTGGAAGCCAT TAT CT ACT 180 

Qy 181 GAT GG AC CG GGT T T CT C AG AT T CT T CAAGAT C AC G GT C AT AAT GT C AC C AT GCT TAAC C A 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GAT G G AC CGGGTTTCT CAGAT T C TT CAAGAT CAC GGT CAT AAT GT C AC CAT G CT T AAC C A 240 

Qy 241 C AAAAGAG GT C CT T T TAT G C CAGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT T AT C AG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I II I I I II I I I II I I I I I I 
Db 241 C AAAAGAGGT C CT T T T AT GC CAGAT T T T AAAAAG GAAGAAAAAT CAT AT CAAGT TAT C AG 300 

Qy 301 T T GG C T T GC AC CT GAAGAT CAT C AAAGAGAAT T T AAAAAGAGT T T T GAT TTCTTTCT GGA 3 60 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 
Db 301 TT GGCTT GCACCT GAAGAT CAT CAAAGAGAATT T AAAAAGAGT T T T GATT T CT TT CT GGA 3 60 

Qy 361 AG AAAC T T TAG G T G G C AG AG G AAAAT T T G AAAAC T TAT T AAAT G T T C TAG AAT AC T T G G C 420 

I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AGAAAC T T T AG GT G G C AGAG GAAAAT T T G AAAAC T TAT T AAAT GT T C TAG AAT AC T T G G C 420 

Qy 421 G T T G C AGT G C AG T CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT G AG AA 4 8 0 

I II I I I I I I I I I I II I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GT T GC AGT G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT GAGAA 48 0 

Qy 4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

II I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I I I I I I II I I I I II I I I I I 

Db 481 CT T C GAC AT GGT GAT AGTT GAAAC T T T T GACT AC TGTCCTTTCCT GAT T G CT GAGAAGC T 54 0 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I II I I I I I I I I II I 
Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 

I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 

661 G G G C C G AGT G AAG AAT T T T C T GAT GT T C T T TAG T T T C T G C AG GAG G C AAC AG C AC AT G C A 
I I I I I I I I I I I I I I I I I I I I II I I I I I 1 I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 

721 GT CT AC AT T T GAC AAC AC CAT C AAGGAACAT T T C AC AG AAG G C T CT AGG C C AGT T T T GT C 
I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
721 GT CT AC AT T T GACAAC AC CAT CAAGGAAC AT T T C ACAGAAG GCT CT AGG C CAGT T T T GT C 



660 



660 



720 



720 



780 



780 



781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7 81 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 



8 41 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 

I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I 
8 41 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 



901 



901 



961 



961 



AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 



900 



900 



960 



960 



GAC CTT GG GCT C CAT GGT GAACAC CT GT CAGAAT C C GGAAAT C T T CAAGGAGAT GAACAA 102 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAC CT T GG GCT C CAT GGT GAACAC CT GT CAGAAT CC GGAAAT CTT CAAGGAGAT GAACAA 1020 



1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 GG CT C AC C CAAGC AT C C GT CT GT TT GT C AC CCAC GGC G GG CAGAAT AGC AT AAT G GAG GC 1200 

12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I M I I I I I I I I I II I I I I I I 

12 01 CAT C C AG CAT GGTGTGCC CAT G GT G G G GAT CCCTCTCTTTG GAG AC C AG C C T G AAAAC AT 12 60 

12 61 G G T C C GAG T AGAAGC C AAAAAGT TTGGTGTTTC TAT T CAGT T AAAGAAG C T C AAG G C AG A 132 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
12 61 G GT C C GAG T AGAAG C C AAAAAGT TTGGTGTTTC TAT T C AG T T AAAGAAG CT C AAG G C AG A 132 0 

1321 GAC AT T G G C T C T T AAGAT G AAAC AAAT CAT G G AAGACAAGAGAT AC AAGT C C GC G G CAGT 13 8 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1321 GACATT GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGT CCGCGGCAGT 1380 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

I | | I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 



Qy 1441 GAT T GAC C AC GT C C T C CAGAC AG GGGG C G C GAC GC AC C T CAAG C C CT AT GT C T T T C AG CA 1500 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GAT T GAC C AC GT CCT C CAGAC AG GGG GC GC GACG C AC CT CAAG C C CT AT GT CT T T C AG C A 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I II I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I I I I I I I I I I I II I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1741 TATCTCCTGTTTTCTTG7^AGAACAGGAA7^AATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

Qy 1981 C GAAT CAC AC C CT GACT CT T C C AGC CT C CAT GT C CAGACCT AGT CAG C CT CT CT CACT C C 2 04 0 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 C GAAT CAC AC CCT GACT C T T C C AGC CT C CAT GT C CAGAC C T AGT CAG C C T C T CT CAC T C C 2040 

Qy 2 041 T GC C C C T AC TAT C TAT CAT G GAAT AAC AT C CAAGAAAGAC AC C T T GC AT AT T C T T T C AGT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 041 T G C C C C T AC TAT C T AT CAT G GAAT AAC AT C CAAGAAAGAC AC C T T G CAT AT T C T T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I II I I I II I I I I I I I I I I I I I I I I II II II I I I I I II I I I I I II I I I I I I I I I I I II I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

Qy 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 



Db 



I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 
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Query Match 100.0%; Score 2320; DB 13; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 232 0; Conservative 0; Mismatches 0; Indels 0; Gaps 



Qy 

Db 



1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I M I I I I 
1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 



Qy 

Db 



61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 



Qy 

Db 

Qy 

Db 



121 GCT CT C AGAGGCT GCCAAAAT CCT GACAAT AT CTACAGTAGGT GGAAGC CATTAT CT ACT 18 0 

M I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I II II I I I I I II I I 
121 GCTCTCAGAGGCT GCCAAAAT CCT GACAAT AT CTACAGTAGGT GGAAGC CAT TAT CTACT 18 0 

181 GAT G GAC CGGGTTTCT C AGAT T C T T C AAGAT C AC G GT C AT AAT GT C AC CAT GCT T AAC C A 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I 

181 GAT GGAC CGGGTTTCT CAGAT T CT T CAAGAT C AC G GT CAT AAT GT C AC CAT GCT T AAC C A 2 40 



Qy 



241 CAAAAGAGGT C CT T T TAT G C C AGATTTT AAAAAGGAAGAAAAAT CAT AT C AAGT TAT C AG 3 00 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M 

Db 241 C AAAAG AG G T C C T T T TAT G C C AG AT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 300 

Qy 301 T T GG C T T GC AC CT GAAGAT CAT C AAAG AGAAT T T AAAAAGAGT T T T GAT TTCTTTCTG GA 360 

I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T T GG C T T GC AC CT GAAGAT CAT CAAAGAGAAT T T AAAAAGAGTT T T GAT TTCTTTCTG GA 360 

Qy 361 AGAAACT T T AGGT GG C AGAGGAAAAT T T GAAAAC T TAT T AAAT GT T CT AGAAT AC T T G GC 42 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AGAAACT T T AGGT G G C AGAGGAAAAT T T GAAAAC T TAT T AAAT GT T CT AGAAT AC T T G G C 42 0 

Qy 421 GTT GCAGT GCAGT CATT TT TTAAATAGAAAGGATAT CATGGATT CCTT AAAGAAT GAGAA 48 0 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 421 GT T G C AGT G CAGT C ATT T T TTAAATAGAAAGGATAT CAT G GAT T C C T TAAAGAAT GAGAA 48 0 

Qy 481 C T T C GACAT G GT GAT AGT T GAAACT T T T GACTAC TGTCCTTTCCT GAT T GCT GAGAAG CT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CT T C GACAT GGT GAT AGT T GAAACT T T T GAC TACT GT C CT TT C C T GAT T GCT GAGAAG C T 54 0 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 GGGCC GAGTGAAGAATTTT CT GAT GTT CTTTAGTTTCT GCAGGAGGCAACAGCACAT GCA 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 

Db 661 GGGCCGAGTGAAGAATTTT CT GAT GTT CTTTAGTTTCT GCAGGAGGCAACAGCACAT GCA 72 0 

Qy 721 GTCTACATTTGACAACACCAT CAAGGAACATTT CACAGAAGGCTCTAGGCCAGTTTT GT C 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GT C T AC AT T T GACAACAC CAT CAAG GAACAT T T CAC AGAAGGCT CT AGGC CAGT T TT GT C 780 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

Qy 901 AGTACCACAAGACTT GGAGAACTT CATT GCCAAGTTTGGGGACT CT GGTTTT GTCCTT GT 960 

I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

Qy 961 GAC CT T G G G CT C CAT GGT GAAC AC C T GT C AG AAT C C GGAAAT CT T CAAG GAG AT G AAC AA 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I II I I I I I I I I I I II I I I I I I I I 
Db 961 GACC T T GG G CT C CAT GGT GAACAC CT GT CAGAAT C C G GAAAT CT T CAAGGAGAT GAACAA 1020 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

Qy 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 0 0 

12 01 CAT C C AGC AT GGT GT G C C CAT GGT G G G GAT CCCTCTCTTTG G AGAC C AG C CT GAAAAC AT 12 60 

I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

1201 CAT C C AGC AT GGT GT GC C CAT GGT G G G GAT C C CT CT CT TT G GAGAC CAGC C T GAAAAC AT 1260 

12 61 G GT C C GAG T AGAAG C C AAAAAGT TTGGTGTTTC TAT T C AGT T AAAGAAG C T C AAG G C AG A 132 0 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 GGT C C GAGT AGAAG C CAAAAAGT T T G GT GT T T CT AT T C AGT T AAAGAAGC T CAAG GC AGA 132 0 

1321 GACATT GG CT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGT CC GCGGCAGT 1380 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 

1321 GACATT GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGT CC GC GGCAGT 1380 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I I I I I I I I I II I I I I I I II I I 1 I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

13 81 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

14 41 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1441 GAT T GACC AC GT C CT C CAGAC AG GG G G C G C GAC GC AC C T CAAGC C CT AT GT C T T T C AGCA 1500 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I 

1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

1741 TATCTCCTGTTTTCTTG7^AGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I II I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I 

18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

I I II I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I 

1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 



Qy 19 81 C GAAT C ACAC C C T G AC T C T T C C AGC CT C CAT GT C C AGAC CT AGT C AG CC T CT CT CAC T C C 204 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I M I II I I I I I I I I I I I I I 
Db 19 81 C GAAT CACACC C T GAC T CT T C CAGC C T C CAT GT C C AGAC CT AGT C AGC CT CT CT CAC T C C 2 04 0 

Qy 2 041 T G C C C C TACT AT CT AT CAT G GAAT AACAT C CAAGAAAGAC AC C T T G CAT AT T CT TT C AGT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I 
Db 2 041 T G C C C C TACT AT CT AT CAT G GAAT AACAT C CAAGAAAGAC AC C T T G CAT AT T C T T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I II I I I I I I II I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 80 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I 
Db 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 

Qy 22 81 AAT AAAAGT T T AC AG C GT TAT CT C T C C C C AAC CT C ACT AA 232 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I II I II I I I I I I I 
Db 22 81 AAT AAAAGT T T ACAGC GT TAT CT CT C C C CAAC C T C ACT AA 232 0 



RESULT 5 

US-10-015-499A-281 

Sequence 281, Application US/10015499A 
Publication No. US20030065142A1 
GENERAL INFORMATION: 
APPLICANT: Baker, Kevin P. 
APPLICANT: Botstein, David 
APPLICANT: Desnoyers, Luc 
APPLICANT: Eaton, Dan 1. 
APPLICANT: Ferrara, Napoleone 
APPLICANT: Fong, Sherman 
APPLICANT: Gao, Wei-Qiang 
APPLICANT: Goddard, Audrey 
APPLICANT: Godowski, Paul J. 
APPLICANT: Grimaldi, Christopher J. 
APPLICANT: Gurney, Austin L. 
APPLICANT: Hillan, Kenneth J. 
APPLICANT: Pan, James 
APPLICANT: Paoni, Nicholas F. 

TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 
TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2830P1C42 

CURRENT APPLICATION NUMBER: US/ 10/ 015 , 4 99A 
CURRENT FILING DATE: 2001-12-11 

Prior Application removed - See File Wrapper or Palm 
NUMBER OF SEQ ID NOS : 477 
SEQ ID NO 281 
LENGTH: 2320 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-015-499A-281 



Query Match 100.0%; Score 2320; DB 13; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 232 0; Conservative 0; Mismatches 0; Indels 0; Gaps 



Qy 


1 
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DD 
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Qy 
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DD 


£1 
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Qy 
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1 oi 
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Qy 


181 


Dd 
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Qy 
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Dd 




Qy 


301 


Dd 


oUl 


Qy 


361 


DD 
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Qy 


421 


DD 




Qy 


/I Q 1 
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JJD 


A ft 1 

4 O J_ 


Qy 




DD 


«J *± X 


Qy 


601 


Db 


601 


Qy 


661 


Db 


661 


Qy 


721 


Db 


721 



AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

II I I I I I ! I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

GCT C T C AGAG GC T G CCAAAAT CC T GACAAT AT C T AC AGT AGGT GGAAGC CAT TAT C T AC T 180 

I I I I I II I I I I II I I I I I I I 1 I I I M I I I I I I I M 1 I I I I I II I I I I I I I I I I I I I I I I I 

G CT C T CAGAGGC T G C CAAAAT C C T GACAAT AT CT AC AGT AGGT GGAAGC CAT TAT C T AC T 180 

GAT G GAC CGGGTTTCT C AGAT T CT T C AAGAT CAC G GT C AT AAT GT C AC CAT GCT T AAC C A 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAT GGAC CGGGTTTCT C AGAT T CT T CAAGAT CAC GGT CAT AAT GT CAC CAT GCT T AAC C A 24 0 

C AAAAGAGGT C C T T T TAT G C C AGAT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT C AG 300 
I | | | I I I I I I I I I I I I II I I I I I I I II I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
CAAAAGAGGT CCTTTTAT GC C AG AT TTT AAAAAGGAAGAAAAAT CAT AT CAAGT TAT CAG 300 

TTGGCTTG CAC C T G AAGAT CAT C AAAG AGAAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 360 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
T T GGC T T GCAC C T GAAGAT CAT CAAAGAGAAT T T AAAAAGAGT TTT GAT T T CTT T C T GGA 360 

AG AAAC T T TAG G T G G CAG AG G AAAAT T T G AAAAC T TAT T AAAT GT T C TAG AAT AC T T G G C 420 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
AGAAACT TT AG GT GGCAGAG GAAAAT T T GAAAACT T AT T AAAT GT T CT AGAAT ACT T GGC 420 

GT T GC AGT GC AGT CAT T T T TT AAAT AGAAAG GAT AT CAT GGAT T C CT TAAAGAAT GAGAA 4 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

GT T G C AGT GC AGT CAT T T T TT AAAT AGAAAGGAT AT CAT G GAT T C CT TAAAGAAT GAGAA 48 0 

CT T C GAC AT GGT GAT AGT T GAAAC T T T T GACT ACT GT C CT TT C CT GATT G C T GAGAAG CT 540 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I 
AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

G G G C C G AGT G AAG AAT T T T C T GAT GT T C T T TAG T T T C T G CAG GAG G C AAC AG CAC AT G C A 72 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I 

G G G C C GAG T GAAG AAT T T T C T GAT G T T C T T T AGT T T C T G CAG GAG G C AAC AG CAC AT G C A 72 0 

GT C T AC AT T T G ACAAC AC CAT CAAG GAAC AT T T CAC AG AAG GCT CT AG G C C AGT T T T GT C 7 8 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

GT C T AC AT T T GAC AAC AC CAT CAAG GAAC AT T T C AC AG AAG GC T C TAG G C C AGT TTT GT C 780 



Qy 


781 


Db 


781 


Qy 


841 


Db 


841 


Qy 


901 


Db 


901 


Qy 


961 


Db 


961 


Qy 


1021 


Db 


1021 


Qy 


1081 


Db 


1081 


Qy 


1141 


Db 


1141 


Qy 


1201 


Db 


1201 


Qy 


1261 


Db 


1261 


Qy 


1321 


Db 


1321 


Qy 


1381 


Db 


1381 


Qy 


1441 


Db 


1441 


Qy 


1501 


Db 


1501 


Qy 


1561 


Db 


1561 



TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I I I I I I I I | I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I M 
TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I 1 I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

GACCTTGGGCT CCAT GGT GAACACCT GT CAGAAT CC GGAAAT CTT CAAGGAGAT GAACAA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I 

G AC CTTGGGCTC CAT GGT G AAC AC C T G T CAGAAT C C G G AAAT CTT C AAG GAG AT GAACAA 1020 
TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I 1 1 1 1 1 M 1 1 1 | 1 1 1 1 1 I 1 1 I 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 II 1 1 1 1 1 I I II II II I 1 1 1 1 I II 1 1 

TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

AGAT GT C CAC CT GGCT G C AAAT GT GAAAAT T GT G GACT GG CT T C CT C AGAGT GAC CT C CT 114 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

GGCT CAC C C AAGC AT CCGTCTGTTTGT CAC C CAC GGC GGG C AGAAT AGC AT AAT GGAG G C 12 00 

I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I II 

GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I 

CAT C CAGCATGGT GT GC CCAT GGT GGGGAT C C CT CT CTTT GGAGACCAGCCT GAAAACAT 12 60 

GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCT^AGGCAGA 1320 

I I I I I I I I I I I I I I I I II I I I I I I I I I I II I II I I I I M I I I I I I I I I I I I I I I I I I I I I 

GGT CC GAGT AGAAGC CAAAAAGTTT GGT GTTT CT AT T CAGTTAAAGAAGCT CAAGGCAGA 1320 

GAC AT T GGCT C T TAAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT C C GC GGC AGT 13 8 0 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
GAC AT T G G CT C T TAAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT C C G C G GC AGT 138 0 

GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

GAT T GAC CAC G T C C T C C AG AC AG G G G G C G C GAC G CAC C T C AAG C C C T AT GT C T T T C AG C A 15 00 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 

GAT T GAC CAC GT C C T C C AG AC AG G G G G C G C GAC G CAC C T C AAG C C C TAT GT C T T T C AG C A 1500 

GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1 62 0 

I I I I I I I I I I I I I I M I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 



Qy 



1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 



1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 II II I 

Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 4 0 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I II I I I I I I I I I I 
Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I i I I I I I I I I I I I I I 
Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

Qy 2041 T GC C CCT ACT AT CT AT CAT G GAAT AAC AT C CAAGAAAGAC AC CT T G CAT AT T CT T T C AGT 2100 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 T G C C CCT ACT AT CT AT CAT G GAAT AACAT C CAAGAAAGAC AC C T T G CAT AT T CT T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I I I I I I I I I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I II I 

Db 2221 C AGT GAG CT C CT T CTT GGCT GAG C AG GC AT GGAGACT GT AGGT T T C C AG AT T T C CT GAAA 22 8 0 

Qy 22 81 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 



RESULT 6 

US-10-226-254A-281 

; Sequence 281, Application US/10226254A 

; Publication No. US20030224 47 8A1 

; GENERAL INFORMATION: 

; APPLICANT: Baker, Kevin P. 

; APPLICANT: Botstein, David 

; APPLICANT: Desnoyers, Luc 

; APPLICANT: Eaton, Dan 1. 



APPLICANT: Ferrara, Napoleone 
APPLICANT: Fong, Sherman 
APPLICANT: Gao, Wei-Qiang 
APPLICANT: Goddard, Audrey 
APPLICANT: Godowski, Paul J. 
APPLICANT: Grimaldi, Christopher J. 
APPLICANT: Gurney, Austin L. 
APPLICANT: Hillan, Kenneth J. 
APPLICANT: Pan, James 
APPLICANT: Paoni, Nicholas F. 

TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 
TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2830P1C68 

CURRENT APPLICATION NUMBER: US/10/226, 254A 
CURRENT FILING DATE: 2002-08-21 
PRIOR APPLICATION NUMBER: 60/098716 
PRIOR FILING DATE: 1998-09-01 
PRIOR APPLICATION NUMBER: 60/098723 
PRIOR FILING DATE: 1998-09-01 
PRIOR APPLICATION NUMBER: 60/098749 
PRIOR FILING DATE: 1998-09-01 
PRIOR APPLICATION NUMBER: 60/098750 
PRIOR FILING DATE: 1998-09-01 
PRIOR APPLICATION NUMBER: 60/098803 
PRIOR FILING DATE: 1998-09-02 
PRIOR APPLICATION NUMBER: 60/098821 
PRIOR FILING DATE: 1998-09-02 
PRIOR APPLICATION NUMBER: 60/098843 
PRIOR FILING DATE: 1998-09-02 
PRIOR APPLICATION NUMBER: 60/099536 
PRIOR FILING DATE: 1998-09-09 
PRIOR APPLICATION NUMBER: 60/099596 
PRIOR FILING DATE: 1998-09-09 
PRIOR APPLICATION NUMBER: 60/099598 
PRIOR FILING DATE: 1998-09-09 

Remaining Prior Application data removed - See File Wrapper or PALM. 
NUMBER OF SEQ ID NOS : 477 
SEQ ID NO 281 
LENGTH: 2320 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-226-254A-281 

Query Match 100.0%; Score 2320; DB 13; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I II I I I I I I I I I I 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 



Qy 



121 GC T CT CAGAGGCT GC CAAAAT C C T GAC AAT AT C T AC AGT AGGT G GAAGC C AT TAT CT AC T 18 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 121 GCT CT CAGAGGCT GCCAAAATCCTGACAATAT CTACAGTAGGT GGAAGCCATTATCTACT 18 0 

Qy 181 GAT GGAC CGGGTTTCT C AGAT T C T T CAAGAT C AC G GT C AT AAT GT C AC CAT GCT T AAC C A 240 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 181 GAT G G AC CGGGTTTCT C AG AT T C T T CAAGAT C AC G G T CAT AAT GT C AC CAT GCT T AAC C A 240 

Qy 241 C AAAAGAG GT C C T T T TAT G C C AGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT T AT C AG 3 00 

I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CAAAAGAGGT C CTT T TAT GC C AGAT T T T AAAAAGGAAGAAAAAT CAT AT CAAGT TAT C AG 300 

Qy 301 TTGGCTTG C AC C T G AAG AT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 3 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T T GGCTT GCAC C T GAAGAT CAT CAAAGAGAAT T TAAAAAGAGT T T T GAT TTCTTTCTG GA 360 

Qy 361 AGAAAC T T T AG GT G G C AGAGGAAAAT T T GAAAAC T TAT T AAAT GT T CT AGAAT AC T T G G C 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AGAAACT T TAG GT GGC AGAGGAAAAT T T GAAAAC T TAT T AAAT GT T CT AGAAT AC TT GG C 42 0 

Qy 421 GT T GCAGT GCAGT CATT TTTT AAAT AGAAAGGATAT CAT GGATT C CT T AAAGAAT GAGAA 4 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 421 GT T GCAGT GCAGT C AT TT T T T AAAT AGAAAGGATAT CAT GGATT C CTTAAAG AAT GAGAA 4 80 

Qy 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I II I I I I I I I I I I I 
Db 481 CT T C GAC AT G GT GAT AGT T GAAACT T T T GACT AC T GT CCTTTCCT GAT T G CT GAGAAGC T 54 0 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 G G G C C GAGT GAAGAAT T T T CT GAT GT T C T T T AGT T T C T G CAGGAGGCAAC AG C AC AT G C A 720 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 661 GGGCC GAGT GAAGAATT TT CT GAT GT T CTTTAGTT T CT GCAGGAGGCAACAGCACAT GCA 720 

Qy 721 GT CT ACATTT GACAAC AC CAT CAAGGAACATT T CACAGAAGGCT CT AGGCCAGTT T T GT C 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I 
Db 721 GT CTACATTT GACAAC AC CAT CAAGGAACATT T CACAGAAGGCT CTAGGC CAGTTTT GT C 7 80 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I II II I I I I I II 
Db 781 T CAT CTT CT ACT GAAAG C AGAGT T GT GGTT CAT T AAC T CT GACT T T GC C T T T GAT TT T G C 840 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 9 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 9 00 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I II II I I I I I I I 
Db 901 AGTACCACAAGACTT GGAGAACTTCATTGCCAAGTTT GGGGACTCT GGTTTT GT C CTT GT 960 

Qy 961 GAC CTTGGGCTC CAT G G T G AAC AC C T G T C AGAAT C C G GAAAT CTT C AAG GAG AT G AAC AA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 961 GAC CTTGGGCTC CAT G GT GAACAC C T GT CAGAAT C CG GAAAT CTT CAAG GAGAT GAACAA 1020 



Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

Qy 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II II I I I I I I I I I I I I | | | | | | | | 
Db 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

Qy 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

Qy 1201 CAT C CAGCAT GGT GTGC C CAT GGT GGGGAT C CCT CT CTTT GGAGACCAGCCT GAAAACAT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 01 CAT C C AG CAT GGTGTGCC CAT G G T G G G GAT CCCTCTCTTTG GAG AC C AG CCT GAAAACAT 1260 

Qy 1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 G GT C C GAGT AGAAG C CAAAAAGT T T G GT GT T T CT AT T C AGT TAAAGAAG CT C AAGGC AGA 132 0 

Qy 1321 GACATTGGCT CTTAAGATGAAACAAAT CAT GGAAGACAAGAGATACAAGT CCGCGGCAGT 1380 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || I 
Db 1321 GACATT GGCT CT TAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGT C C GCGGCAGT 1380 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1441 GAT T GACCAC GT C CT C CAGAC AGG G GGC GC GAC GC AC C T C AAG C C CT AT GT CTTT CAG C A 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I || I | | | | || | | | | | | | | | | | 

Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I 
Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I I I I I M II I I I I I I II I I I I I I I I I I I I I II I II I I I I I I I I I I I I | | | | | I | | | 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 4 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I II 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I 
Db 17 41 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I II 
Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 



Qy 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

I I I I I I I II I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTT7\AAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I | | I I I I I I I | I I I 

Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 204 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2040 

Qy 2041 T GCC C CTACT AT CTAT CAT GGAATAACATCCAAGAAAGACACCT T GCAT ATT CTTT CAGT 2100 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2 041 T G C C C C T AC TAT C T AT CAT G GAAT AAC AT C C AAGAAAG AC AC C T T G CAT AT T C T T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2221 C AGT GAGCT CC T T C TT GGCT GAGC AG GC AT G GAGACT GT AGGT T T C C AGATT T C CT GAAA 22 8 0 

Qy 2281 AATAAAAGT TT ACAGC GTTAT CT CT C CC CAAC CT CACTAA 232 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22 81 AATAAAAGT T T AC AG C G T TAT CTCTCCC CAAC C T C AC T AA 2 32 0 
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Query Match 100.0%; Score 2320; DB 15; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0 
QY 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I M I I I I I I I I I I I I I I I I I I I I I | | M I I I I I I I I I I I I I I I II I I II I I I I I I I I 

Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I M I I I I I I I I I I ! I I I I I I I I I I II I I I I I I I I I I I I I | I | | | I I I I I I | | I I 

Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

Qy 121 GCTCTCAGAGGCTGCCAAAATCCTGACAATATCTACAGTAGGTGGAAGCCATTATCTACT 18 0 

I M I I I I I I I I I I I I II I I M I I I I I I I II I I I I I I I I I I I I I I I I I | | | | | | | | | || | | 
Db 121 GCTCTCAGAGGCTGCCAAAATCCTGACAATATCTACAGTAGGTGGAAGCCATTATCTACT 18 0 

Qy 181 GAT G GAC C GGGT T T CT CAGAT T CT T C AAGAT CAC G GT C AT AAT GT C AC CAT G CT TAAC CA 24 0 

I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I | | | | M 
Db 181 GAT GGAC CGGGTTTCT CAGAT T C TT CAAGAT CAC GGT CAT AAT GT CAC CAT G CT TAAC C A 24 0 

Qy 241 CAAAAGAG GT C C T T T TAT G C CAGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 30 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CAAAAGAG GT C C T T T TAT G C CAGAT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT C AG 30 0 

Qy 301 TTGGCTTG CAC C T G AAGAT CAT C AAAG AG AAT T T AAAAAGAG T T T T GAT TTCTTTCTG G A 360 

I I I I I I II I I I I I I I I I I I I I I I I I I I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 TT GGCT T GC AC CT GAAGAT CAT CAAAGAGAATTT AAAAAGAGT T T T GAT T T CT T T CT GGA 360 

Qy 361 AGAAAC TT T AGGT GGC AGAG GAAAATT T GAAAACT T AT T AAAT GT T CT AGAAT ACT T GGC 420 

I I I I I I I I I I I I I I I I I I M I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AGAAAC T T TAG GT GG C AGAG GAAAAT T T GAAAACT TAT TAAAT GT T CT AGAAT ACT T GGC 420 

Qy 421 GT T G C AGT G C AGT CAT T T T T TAAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT GAGAA 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GT T G C AGT G C AGT CAT T T T T TAAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT GAGAA 48 0 

Qy 4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I I I I I I I I I I M I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I | I I | | | | | M I I | 
Db 4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

II I I I I I I I I M I I I II I I II I I I I I I I I I I I | | | || | | | | | | | | | | | | | | | | | | 

Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 



in mi ii ii i in 1 1 111 111 1 1 1 1 1 1 1 1 1 1 1 1 1 r j 1 1 1 1 1 1 1 1 1 1 j r 1 1 1 1 1 

661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 
721 GTCTACATTTGACAACACCATCAAGGAACATTTCACAGAAGGCTCTAGGCCAGTTTTGTC 780 

„ n HI M IN I I I I ■(> I I I I ' I ' ' I I I I I I I f I I F I I I I I I I f I I I j J I f I I I I I I 

721 GTCTACATTTGACAACACCATCAAGGAACATTTCACAGAAGGCTCTAGGCCAGTTTTGTC 7 8 0 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

no I ' I I I I I I I I I I I I I I I I M I I I I I N I I I I II I | | | | M I I I I M | || | I | | | | | | | | | 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 8 40 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTA7VA.ee 900 

I I I I M II I I I I I I I I I I II I I I I I I I I II II I I I I I II I I I I I I I I I I I 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 



901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | , | | | | | | | 

AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 



901 



961 GACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGAGATGAACAA 1020 
I I > M I II I I | | | | | | | | | | | | | | | | | | | | || | | | | | | | | | | | 

GACCTTGGGCTCCATGGTGAACACCTGTCAGAATCCGGAAATCTTCAAGGAGATGAACAA 1020 



961 
1021 
1021 



TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 
I I I I I I I I I I I I I II I I I | || | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 



1080 



1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I N M I I I I I I I I I I I IN | || | I I I I I I I I I 

10 81 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 
I I I I I I I I I I I I I I I I M M I I I I I I I I | | | | | | | I I I I I I I I I I I I I I I I I | | I I I I I I 
GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 



1141 
1201 



1200 
1260 



CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 

10ni I'llllllllllllMMIIIIIMIIIIIIIIIIIIIIIIMIIIIIIIIIIIIIIIM 

12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 



1261 
1261 
1321 



GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 
I I I I I I " I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 



1320 
1380 



GACATTGGCTCTTAAGATGAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT 
'I I I I I I I I I I I I II I I I I || | I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 GACATTGGCTCTTAAGATGAAACAAATCATGGAAGACAAGAGATACAAGTCCGCGGCAGT 1380 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

I I I I I I I I I I I I M I I I II M I I II I I I I I | | | | | Ml I I I I II I I I I I I I 

GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 40 



1381 



1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

1 " I I I ' I I I I I I I I I I I I II I I II M I I I I I II | II I I I I I I I I I I I I I I I I I I I I I I I 
1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 



1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 
I II I I I I I I I I I I I I I I I I I I | | II II II I I I I I I I I I I II II I I I I I I I I I 



1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

1C „ 1 1 ' < ' ' 1 < 1 < ' ' ' < ■ ■ I I I ' ' I I I ' I I I I I f I I I I I I I I I I I I I I I I I | I | f | | | 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 



1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 
I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | || | | 

AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 



1621 
1681 
1681 
1741 
1741 
1801 
1801 
1861 



1680 
1680 
1740 



TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 

1 I I M II I I I I I I I | | | | M | | | M I I I I I I I I I I I I | | | M I I I I I I I I I | | | | | | | | | 

TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 



TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 180 0 

M I I M I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I I I I I I I I I I I I II I I I I I I I | I 
ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 



CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I | M | | | | | | || | | | | 

18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 
11 I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | I | | I I I I I I 

TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 
1 1 1 I I I I I I I I I I I I I I I I I I I I I I I I | | | | I I I I I I I I I I I I I I I I I I I I I I I I I | | | | 
CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

T G C C C CT AC TAT C TAT CAT GGAAT AAC AT C CAAGAAAGAC AC C T T GC AT AT T CT T T C AGT 2100 
1 I M I I I I I I I I I I | | I I I I I I I I I I | | | I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | 
T G C C C CT AC T AT CT AT CAT G GAATAAC AT C CAAGAAAGAC AC C T T G CAT AT T C T T T C AGT 



1921 
1921 
1981 
1981 
2041 
2041 
2101 
2101 
2161 



TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 
I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | I I I I I I I I I I I I | | | | | | | | 

TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 



2100 
2160 
2160 
2220 



AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 

0 _ 111 MINI Mill I I I I I I I I I I I I I I I I I I I I I I 

2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 

''''''' I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 

I I I I N I I I I I I I I I I I I I I I I I I I I I I II I I I I | | | | | | 

22 81 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 



-818A-281 



Sequence 281, Application US/10006818A 
Publication No. US20030054406A1 
GENERAL INFORMATION : 
APPLICANT: Baker, Kevin P. 
APPLICANT: Botstein, David 
APPLICANT: Desnoyers, Luc 
APPLICANT: Eaton, Dan 1. 
APPLICANT: Ferrara, Napoleone 
APPLICANT: Fong, Sherman 
APPLICANT: Gao, Wei-Qiang 
APPLICANT: Goddard, Audrey 
APPLICANT: Godowski, Paul J. 
APPLICANT: Grimaldi, Christopher J. 
APPLICANT: Gurney, Austin L. 
APPLICANT : Hillan, Kenneth J. 
APPLICANT: Pan, James 
APPLICANT: Paoni, Nicholas F. 

TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 
TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2830P1C4 

CURRENT APPLICATION NUMBER: US/ 10/ 0 06 , 8 18A 
CURRENT FILING DATE: 2001-12-06 

Prior Application removed - See File Wrapper or Palm 
NUMBER OF SEQ ID NOS : 477 
SEQ ID NO 281 
LENGTH: 232 0 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-006-818A-281 



Query Match 100.0%; Score 2320; DB 15; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 



0; 



Qy 


1 


Db 


1 


Qy 


61 


Db 


61 


Qy 


121 


Db 


121 


Qy 


181 


Db 


181 


Qy 


241 


Db 


241 


Qy 


301 


Db 


301 



AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I II I I I I I I I 1 I I I I I I I I I I I I I II I I I I I I I I II I I I I I I 1 I I I I I I I I I I I I I I I 
AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I | M | I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I II 
AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

GC T C T C AG AG G C T G C C AAAAT C C T GAC AAT AT C T AC AGT AG G T G G AAG C CAT TAT C T AC T 18 0 

I | I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCTCTCAGAGGCTGCCAAAATCCTGACAATATCTACAGTAGGTGGAAGCCATTATCTACT 180 

GAT G GAC CGGGTTTCT C AG AT T C T T C AAGAT C AC G G T CAT AAT GT C AC CAT G CT T AAC C A 240 

I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAT G GAC CGGGTTTCT C AGAT T CT T CAAGAT C AC GGT C AT AAT GT C AC CAT G CT T AAC C A 24 0 

CAAAAGAGGT CCTTTTATGCCAGATTTTAAAAAGGAAGAAAAAT CAT AT CAAGTTAT CAG 300 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I 

C AAAAGAG GT C C T T T TAT GC CAG AT T T T AAAAAG GAAG AAAAAT CAT AT C AAGT TAT CAG 3 00 

TTGGCTTG C AC C T G AAG AT CAT C AAAG AG AAT T T AAAAAG AG T T T T GAT TTCTTTCTG G A 3 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
TTGGCTTG C AC C T GAAG AT CAT C AAAG AG AAT T T AAAAAGAG T T T T GAT TTCTTTCTG G A 3 60 



Qy 361 AGAAAC T T TAG GT G GC AGAG GAAAAT T T GAAAACT TAT T AAAT GT T C T AGAAT AC T T G GC 42 0 

I I I I I I I i I I I I II III I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I II I I I I I I 
Db 361 AGAAACT T T AG GT G G C AGAGGAAAAT T T GAAAAC T TAT T AAAT GT T CT AGAAT ACT T G GC 420 

Qy 421 GT T G CAGT GC AGT C ATT T T T T AAAT AGAAAGG AT AT C AT GGAT T C C T T AAAGAAT GAGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I II I II I I I I I 

Db 421 GT T G C AG T G CAGT CAT T T T T T AAAT AG AAAG GAT AT CAT G GAT T C C T T AAAGAAT GAGAA 480 

Qy 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I t I I I I I I I I I I I 
Db 4 81 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 GGGC CGAGT GAAGAAT T T T CT GAT GT T CT T T AGTT T CT G CAG GAGG CAAC AGCAC AT G CA 72 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II II I I I II I 
Db 661 GGGC CGAGT GAAGAAT TTTCT GAT GTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

Qy 721 GT CT ACATTT GACAACAC CAT CAAGGAACATTT CACAGAAGGCT CTAGGC CAGTTTT GTC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GT CT ACAT T T GACAACAC CAT CAAGGAAC AT TT CAC AGAAG G C T C TAGGC CAGT T T T GT C 7 80 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTT GC 84 0 

I I I I I I I II I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

Qy 901 AGT ACC ACAAGACT T G GAGAAC T T CAT T G CCAAGT T T GGGGAC T CT GGT TTTGTCCTTGT 960 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

Qy 961 G AC CTTGGGCTC CAT GGT GAAC AC C T G T C AG AAT C C G G AAAT C T T C AAG GAG AT GAAC AA 1020 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I II I I I I I I I 
Db 961 G AC CTT GG GCT C CAT GGT GAACAC CT GT CAGAAT C C GGAAAT C T T CAAG GAGAT GAAC AA 1020 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I M I I I I I I I I I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

Qy 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

Qy 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 0 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 



Qy 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I 

Db 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

Qy 1261 G GT C C GAGT AGAAG C C AAAAAGT TTGGTGTTT CT AT T C AGT T AAAG AAG CT C AAG G C AGA 1320 

I I I I I I I I I I I M I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1261 GGTCC GAGT AG AAG C C AAAAAGT TTGGTGTTT CT AT T C AGT T AAAG AAG CT C AAG G C AGA 1320 

Qy 1321 GAC AT T G G C T CT T AAG AT G AAAC AAAT CAT G GAAG AC AAG AGAT AC AAGT C C GC GG C AGT 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I 

Db 1321 GAC AT T G GCT C T T AAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT C C GC GG C AGT 13 8 0 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I 

Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I M I I I I M I I I I M M I I I I I I I I I II I I I I I II I II I I I I II I I I I I I I I I || | | | || 
Db 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

M I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I II I I I I M 

Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | || | | || | | | 

Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TATCTCCT GTTT T CTT GAAGAACAGGAAAAATGGCCAAAAAT CAT C CT T T C CACTT GCTA 1800 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

M I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I I I I I I M I I I I I I II I I I I | I I I I I I I | | | | | | | | | | | | | | | | | | | | | | || | | | | | 
Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

I I M I I I I I I I I I I I I I I I I || I I I I I I || | | | | | | | | | | | | | | | | | | I I I II I I 

Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

I M I I I I I I I I I I I I I I I I I || I I | I || | | | | | | | | | | | | | | | | | | | | | | | | | | | | || | | 
Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

Qy 2041 T G C C C C TACT AT C T AT CAT G GAAT AAC AT C C AAGAAAGAC AC C T T G CAT AT T C T T T C AGT 2100 



Db 2 041 T G C C C CT AC TAT C TAT CAT GGAAT AAC AT C C AAGAAAGAC AC C T T G CAT AT T CT T T C AGT 2100 

QY 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I M I I I II I I I I I I I I I I I I I I I I I | I I M I I I I II II I II I I I I I I II I I I I II I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I I M M I I I I II M I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I | | | | | 

Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 

M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 

Qy 22 81 AAT AAAAGT T T AC AG C GT T AT C T CT C C C C AAC CT C AC T AA 232 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 AAT AAAAGT T T AC AG C GT T AT CT CT C C C CAAC CT C AC T AA 2320 



RESULT 9 

US-10-015-393A-281 

Sequence 281, Application US/10015393A 
Publication No. US20030069179A1 
GENERAL INFORMATION: 
APPLICANT: Baker, Kevin P. 
APPLICANT: Botstein, David 
APPLICANT: Desnoyers, Luc 
APPLICANT: Eaton, Dan 1. 
APPLICANT: Ferrara, Napoleone 
APPLICANT: Fong, Sherman 
APPLICANT: Gao, Wei-Qiang 
APPLICANT: Goddard, Audrey 
APPLICANT: Godowski, Paul J. 
APPLICANT: Grimaldi, Christopher J. 
APPLICANT: Gurney, Austin L. 
APPLICANT: Hillan, Kenneth J. 
APPLICANT: Pan, James 
APPLICANT: Paoni, Nicholas F. 

TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 
TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2830P1C46 

CURRENT APPLICATION NUMBER: US/ 10/015, 393A 
CURRENT FILING DATE: 2002-06-10 

Prior Application removed - See File Wrapper or Palm 
NUMBER OF SEQ ID NOS: 477 
SEQ ID NO 281 
LENGTH: 2320 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-015-393A-281 



Query Match 100.0%; Score 2320; DB 15; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 2320; Conservative 0; Mismatches 



Length 2320; 
0; Indels 0; Gaps 



0; 



Qy 



1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 



Db 


1 


Qy 


61 


Db 


61 


Qy 


121 


Db 


121 


Qy 


181 


Db 


181 


Qy 


241 


Db 


241 


Qy 


301 


Db 


301 


Qy 


361 


Db 


361 


Qy 


421 


Db 


421 


Qy 


481 


Db 


481 


Qy 


541 


Db 


541 


Qy 


601 


Db 


601 


Qy 


661 


Db 


661 


Qy 


721 


Db 


721 


Qy 


781 


Db 


781 


Qy 


841 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 



AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I 
AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

GC T C T C AGAG G C T G C C AAAAT C C T G AC AAT AT C T AC AGT AG GT G G AAG C CAT TAT C T AC T 180 
I I I I I I M I I I II I I I I I M I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I | | | | 
GC T CT C AGAG G C T G CCAAAAT C CT GACAAT AT CT AC AGT AGGT GGAAG C CAT TAT CT AC T 180 

GAT G GAC C G GGT T T CT CAGAT T CTT C AAGAT C AC G GT CAT AAT GT C AC CAT G CT TAAC C A 240 

I I I M I I I I I I I I I I I I I I I I II I M I I I I M II I I I I I I I I I I I I I I I I I I I II I I I I I 

GAT GGAC C GGGT TT CT CAGATT CTT CAAGAT CAC GGT CAT AAT GT CAC CAT GCTTAACC A 240 

C AAAAG AG GT C C T T T TAT G C CAGAT T T T AAAAAG G AAGAAAAAT CAT AT C AAGT TAT C AG 300 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
C AAAAGAGGT C CT T TT AT GC CAGAT TT TAAAAAGGAAGAAAAAT CAT AT CAAGT TAT CAG 300 

TTGGCTTG CAC C T GAAGAT CAT C AAAGAGAAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 360 

I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I 
TTGGCTTGCACCT GAAGAT CAT CAAAGAG AAT TTAAAAAGAGTTTTGATTTCTTTCTGG A 360 

AG AAAC T T TAG GT G G CAG AG GAAAAT T T GAAAAC T TAT T AAAT GT T C T AGAAT AC T T GG C 420 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I | | | 
AG AAAC T T TAG G T G G CAG AG GAAAAT T T GAAAAC T TAT T AAAT G T T C TAG AAT AC T T G G C 420 

GT T G C AGT GCAGT CAT T T TT T AAAT AGAAAGGATAT CAT G GAT T C CT T AAAGAAT GAGAA 4 8 0 

I I I I I I I I I I I I I I I II I I I I II I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I 

GT T G C AGT G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT GAGAA 4 8 0 

C T T C GAC AT GGT GAT AGT T G AAAC T T T T GAC T AC TGTCCTTTCCT GAT T G C T GAG AAG C T 54 0 
M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I II I I 
CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I II II I I I I I I I I I I I I I I I I I I 
TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

AAT CCCCTTGTCT TAT GT T C CAGT AT TCCGTTCCTT GCT GACT GAT CAC AT GGACT T C T G 660 

I I I M I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

I I I I I I II I I I I I I I I I I I I I I II I I II I I I I I I I I II 

GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 



I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 



TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 8 4 0 

M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 
I I I I I I I I I I I I I I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 



901 



901 



961 



AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 



GAC CT T G G GCT C C AT GGT GAAC AC CT GT C AGAAT C C GGAAAT CT T CAAG GAGAT GAACAA 102 0 
I I I I I I I I I I I I I I I I I I I I I I I M I M I II I I I I I I I I || | | | | | | | | | | | | | || | | | I 
9 61 GAC CTTGGGCTC C AT GGT GAACACCT GT C AGAAT C C GGAAAT CT T C AAGGAGAT GAACAA 102 0 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 10 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

1141 GGCT CAC C CAAGC AT C C GT CT GT TT GT CAC CCAC GGC G GG CAGAAT AG C AT AAT GGAGGC 1200 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 GGCT CACCCAAGCATCCGTCTGTTTGT CAC CCACGGCGGGCAGAATAGCAT AAT GGAGGC 12 00 

1201 CAT C C AGC AT GGT GT GC C CAT GGT G GG GAT C C C T CT CT TT GGAGAC CAGC CT GAAAAC AT 1260 

I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | || | | | | | | | | | | | | | | | | | | | | 
12 01 CAT C CAG CAT G GT GT GC C CAT GGT G G GGAT CCCTCTCTTTG GAGAC C AGC CT GAAAAC AT 12 60 

1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I | | | | | | | | | | | 
1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 

1321 GAC AT T GGC T CT T AAG AT GAAAC AAAT CAT G GAAG AC AAGAGAT AC AAGT CCGCGG C AGT 1380 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I | | | | | 
1321 GAC ATT G G CT C T T AAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT C C GC GG CAGT 1380 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I || | | | | | | || | | | 
1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1 62 0 

1621 AAAG GT GAAG GAGACATAAGGC CAG GTGCAGCCTTGGCGGGGTCTGTTT GGT GGGC GAT G 1680 

M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I II I I I I I I II I I I 
1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I II I I I I I I I I II I I I I II I I I I I I I 
1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 



Qy 


1741 


TATCTCCTGTTTTCTTGAA.GAACAGG7\AAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 
M 1 1 I 1 1 I 1 I 1 1 1 1 i 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 | | ( | | | | | M 1 1 1 1 1 I I I I I I I I | | | I I 
TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 


Db 


1741 


Qy 


1801 


ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 
1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 | I | | | | | | || | | | | | | | | | | | | | | | | M 
ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 


Db 


1801 


Qy 


1861 


CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 

CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 


Db 


1861 


Qy 


1921 


TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 


Db 


1921 


Qy 


1981 


CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 
1 M 1 1 1 II 1 1 1 1 1 I 1 1 I I I I I I I I | | | | | | | M 1 1 1 1 1 1 1 1 1 1 I I I I I I I | | | | | | | M | 
CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 


Db 


1981 


Qy 


2041 


T GC C C CT ACTAT C TAT CAT GGAAT AAC AT C C AAGAAAG AC AC C T T G CAT AT T C T T T C AGT 2100 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

T GCC CCT ACT AT CTAT CAT GGAAT AAC AT C C AAGAAAGACAC CT T G CAT AT T C T T T C AGT 2100 


Db 


2041 


Qy 


2101 


TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 
1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 


Db 


2101 


Qy 


2161 


AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 
1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I | | | 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 I I I M I 
AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 


Db 


2161 


Qy 


2221 


CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 
1 1 II 1 1 M 1 M 1 1 1 1 1 1 1 1 II 1 1 1 I I I I | | | | | | | || || || | | | | || | | | | || | | | | | || 
C AGT GAG CT CCTT CT T G GC T GAG C AGG CAT G GAGACT GTAGGTT T C C AGAT T T C CT GAAA 22 8 0 


Db 


2221 


Qy 


2281 


AAT AAAAGT T T AC AG C GT T AT C T C T C C C C AAC C T C ACT AA 2 320 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 
AAT AAAAGT T T AC AG C GT T AT C T C T C C C C AAC C T C ACT AA 232 0 


Db 


2281 



RESULT 10 

US-1 0-015-8 69A-2 81 

Sequence 281, Application US/10015869A 
Publication No. US20030073130A1 
GENERAL INFORMATION: 



APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 



Baker, Kevin P. 
Botstein, David 
Desnoyers, Luc 
Eaton, Dan 1. 
Ferrara, Napoleone 
Fong, Sherman 
Gao, Wei-Qiang 
Goddard, Audrey 
Godowski, Paul J. 
Grimaldi, Christopher J. 



APPLICANT: Gurney, Austin L. 
APPLICANT: Hillan, Kenneth J. 
APPLICANT: Pan, James 
APPLICANT: Paoni, Nicholas F. 

TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 
TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2830P1C45 

CURRENT APPLICATION NUMBER: US/10/015, 869A 
CURRENT FILING DATE: 2002-06-25 

Prior Application removed - See File Wrapper or Palm 
NUMBER OF SEQ ID NOS : 477 
SEQ ID NO 281 
LENGTH: 2320 
TYPE : DNA 

ORGANISM: Homo sapiens 
US-10-015-869A-281 

Query Match 100.0%; Score 2320; DB 15; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || | | | | | | | | | | | | | | | | 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

Qy 121 GCT CT CAGAG GCT GC CAAAAT C CT GACAAT AT CT AC AGT AGGT G GAAG CC AT T AT CT ACT 18 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I II I 
Db 121 GCT C T CAGAGG C T G C CAAAAT C C T GACAAT AT C T AC AGT AG GT GGAAGC CAT TAT CT ACT 18 0 

Qy 181 GATGGACCGGGTTT CT CAGAT T CTT CAAGAT CACGGT CATAAT GT CAC CAT GCTTAAC CA 24 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GAT GGAC C GGGT TT CT CAGAT T C T T CAAGAT CAC GGT CATAAT GT CAC CAT G CT T AAC CA 24 0 

Qy 241 CAAAAGAG GT C C T T T TAT GC CAGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 300 

I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 241 CAAAAGAGGT C CT T T TAT GC CAGAT T T T AAAAAGGAAGAAAAAT CAT AT CAAGT T AT C AG 300 

Qy 301 TT GGCT T GCAC CT GAAGAT CAT CAAAGAGAATT T AAAAAGAGT T T T GATT T CT T T CT G GA 360 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 301 TTGGCTTG CAC C T GAAGAT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 360 

Qy 3 61 AGAAACT T TAGGT GGCAGAGGAAAAT T TGAAAACTTAT T AAAT GTT CT AGAAT ACT T GGC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AG AAAC T T T AG G T G G CAGAG G AAAAT T T G AAAAC T TAT T AAAT GT T C TAG AAT AC T T G G C 420 

Qy 421 GT T GCAGT GC AGT CAT T T T T T AAAT AG AAAG GAT AT CAT GG AT T C CT T AAAGAAT GAGAA 4 80 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GT T G C AGT GCAGT CAT T T T T T AAAT AGAAAGGAT AT CAT G GAT T C C T T AAAGAAT GAGAA 4 80 

Qy 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

M I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 



Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

I I I I I I I I II I I I I I II I I I II I I I I I I I I I I M | I | | | | | | | M I I I I I I I I I I I I I I I 
Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I II 
Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 G GG C C GAGT GAAGAAT T T T CT GAT GT T CT T T AGT T T CT G C AG GAG G C AAC AG C AC AT G C A 720 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I II I II I 

Db 661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 720 

Qy 721 GT CT AC AT T T GACAACACC AT CAAGGAAC AT T T CAC AGAAGGCT CT AG GC C AGTT TT GT C 7 8 0 

I I I M I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I II I I I | | | | 
Db 721 GT CT AC AT T T GACAAC AC CAT CAAGGAAC AT T T CAC AGAAGGCT CT AG GC C AGT T T T GT C 780 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

I I I M I M I I I M I I I I II I I I I I I I I I I I I I I I I || I I I I I I | | | || | | | | | | | | | | | | 
Db 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 840 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 9 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 9 60 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I | I I || I | | | | | 
Db 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

Qy 961 GAC CT T GGG CT C CAT GGT GAAC AC C T GT C AGAAT C C G GAAAT C T T C AAGGAGAT GAAC AA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 9 61 GACCTT GGGCT CCAT GGTGAACACCT GT C AGAAT CC GGAAAT CTT CAAG GAG AT GAACAA 102 0 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I II 
Db 1021 T GC CT T T GCT CAC CTAC C C CAAG GGGTGATATGGAAGTGTCAGTGTTCT CAT TGGCCCAA 1080 

Qy 1081 AGAT GT C CAC CT GGCT GCAAAT GT GAAAAT T GT GGACT GG CT T C C T CAGAGT GAC CT C C T 1140 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M M | | | | | | | | | 
Db 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

Qy 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

Qy 12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1201 CAT C C AG CAT GGT GT G C C CAT GGT G G GGAT C C CT CT CT TT G GAGAC C AGC CT GAAAAC AT 1260 

Qy 12 61 GGTCCGAGTAGAAGCCAAAAAGTTT GGT GTTTCTATTCAGTTAAAGAAGCT CAAG GCAGA 132 0 

I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 12 61 GGT CC GAGT AGAAGCCAAAAAGT TT GGT GT TT CTATT CAGT TAAAGAAGCT CAAG GCAGA 132 0 

Qy 1321 GAC AT T G GC T C T T AAGAT GAAACAAAT C AT GGAAGACAAGAGAT ACAAGT C C GC GGC AGT 138 0 

I I I I M I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1321 GACAT T GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT CCGCGGCAGT 1380 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 



1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 

Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 15 00 

I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I ! | | | M | I | | | | I | | | 

Db 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I M I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

M I I I I I I I I I I I I I I I I I I M I I I I I II II I I II I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I | | 
Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 204 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 19 81 CGT^ATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 204 0 

Qy 2041 T G C C C C T AC TAT C TAT CAT G GAAT AAC AT C C AAGAAAGAC AC C T T G CAT AT TCTTTCAGT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 2 041 T GC C C C TACT AT CT AT CAT GGAAT AAC AT C CAAGAAAGACAC C TT G CAT AT T CT T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I M I I I | | I I I || | 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I M I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 CAGT GAGCT C CT T CTT GGCT GAGCAGGCAT GGAGACT GTAGGT T T C C AGATT T C CT GAAA 22 8 0 
I I I I I I I I M I I I | | | | | | | I I I I I I I | | | | || | || | | | | | | | | | | I I II I I I I I 



Db 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTG7WV 2280 

Qy 2281 AAT AAAAGT T T AC AG C GT TAT C T C T C C C CAAC CT C AC T AA 232 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
2281 AAT AAAAGT T T AC AG C GT TAT CT C T C C C CAAC C T C AC T AA 2320 



RESULT 11 

US-10-012-121A-281 

Sequence 281, Application US/10012121A 
Publication No. US20030073810A1 
GENERAL INFORMATION: 
APPLICANT: Baker, Kevin P. 
APPLICANT: Botstein, David 
APPLICANT: Desnoyers, Luc 
APPLICANT: Eaton, Dan 1. 
APPLICANT: Ferrara, Napoleone 
APPLICANT: Fong, Sherman 
APPLICANT: Gao, Wei-Qiang 
APPLICANT: Goddard, Audrey 
APPLICANT: Godowski, Paul J. 
APPLICANT: Grimaldi, Christopher J. 
APPLICANT: Gurney, Austin L. 
APPLICANT: Hillan, Kenneth J. 
APPLICANT: Pan, James 
APPLICANT: Paoni, Nicholas F. 

TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 
TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2 8 3 0P1C20 

CURRENT APPLICATION NUMBER: US/ 10/ 012 , 12 1A 
CURRENT FILING DATE: 2001-12-07 

Prior Application removed - See File Wrapper or Palm 
NUMBER OF SEQ ID NOS: 477 
SEQ ID NO 281 
LENGTH: 2320 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-012-121A-281 



Query Match 100.0%; Score 2320; DB 15; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 232 0; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 
Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I M I I I I I I I I I I II I I I I I I II I | | | | | | | | | | M I I I I I I I i i i i i i m | M I I I I I 

Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I 
Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 

QY 121 G C T C T C AGAGG C T G C C AAAAT C C T GAC AAT AT C TAC AGT AG GT GGAAGC CAT TAT CT AC T 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I | | | | | | | | | | | | | | | | | 
Db 121 GCT C T C AGAG GC T G C C AAAAT C CT GACAAT AT C TAC AGT AG GT GGAAGC CAT TAT CT AC T 180 



Qy 



181 GAT G GAC CGGGTTTCT C AG AT T C T T C AAG AT C AC G GT CAT AAT GT C AC CAT GCT T AAC C A 240 
I I I I I I I I I I I I I I I I I I I I I I I | I | I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | I | | 



Db 


181 


GAT G G AC CGGGTTTCT C AGAT T C T T CAAGAT CAC G GT C ATAAT GT C AC CAT G C T T AAC C A 2 4 0 


Qy 


241 


C AAAAGAG GT C CT T T TAT G C C AGAT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT C AG 

1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 I I I | | | | | || | M 1 1 II 1 II I 1 1 1 1 1 1 1 1 1 

C AAAAGAGGT C CTTT TAT GC CAGAT TT TAAAAAGGAAGAAAAAT CAT AT C AAGT TAT CAG 


300 


Db 


241 


300 


Qy 


301 


TTGGCTTG CAC C T G AAG AT CAT C AAAG AG AAT T T AAAAAG AG T T T T GAT TTCTTTCTG G A 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 


360 


Db 


301 


360 


Qy 


361 


A G AAAC T T TAG G T G G CAG AG G AAAAT T T G AAAAC T TAT T AAAT G T T C TAG AAT AC T T G G C 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGAAAC T T TAG GT GG C AG AGGAAAAT T T GAAAACT TAT T AAAT GT T CT AG AAT AC T T G G C 


420 


Db 


361 


420 


Qy 


421 


G T T G C AGT G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT G AGAA 
1 N 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 II I I I I I | | | | || | | | | 
GT T G C AGT G CAG T CAT T T T T T AAAT AG AAAG GAT AT CAT G GAT T C C T T AAAG AAT G AGAA 


480 


Db 


421 


480 


Qy 


481 


CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | 

CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 


540 


Db 


481 


540 


Qy 


541 


TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 
N II 1 1 1 HI II 1 II M M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 I I I I | | | | | | | | | | | || 
TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 


600 


Db 


541 


600 


Qy 


601 


AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 
1 N 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | || 1 1 1 1 1 1 1 1 1 
AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 


660 


Db 


601 


660 


Qy 


661 


G G G C C GAGT GAAGAAT T T T C T GAT GT T CT T T AGT T T C T G CAG GAGG CAAC AG CAC AT G C A 

1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 

GGGC C GAGT GAAGAATTTT CT GAT GTT CTTTAGT TT CT GCAGGAGGCAACAGCACAT GCA 


720 


Db 


661 


720 


Qy 


721 


GT C T ACAT T T GAC AAC AC CAT CAAGGAAC AT T T C AC AGAAGG C T CT AG GC C AGT T T T GT C 
1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 I I || I I I | | | | | | | | | 
GT C T AC AT T T GAC AAC AC CAT C AAG GAAC AT T T C AC AGAAG G C T C TAG G C CAG T T T T G T C 


780 


Db 


721 


780 


Qy 


781 


TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 
1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 


840 


Db 


781 


840 


Qy 


841 


TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 

TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 


900 


Db 


841 


900 


Qy 


901 


AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 
i i 1 N 1 1 1 1 1 1 1 1 1 1 1 1 I M 1 1 1 1 1 1 1 1 I 1 I I I I I I I | | | | I M | | | | | | | | ] | | | | M | 
AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 


960 


Db 


901 


960 


Qy 


961 


GAC CTTGGGCTC CAT G GT GAAC AC C T GT C AGAAT C C G GAAAT C T T C AAGGAGAT GAAC AA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 I I I I I I I || I I I I I | | | I | | | 
GAC CTTGGGCTC CAT G G T GAAC AC C T G T CAG AAT C C G GAAAT C T T C AAG GAG AT G AA C AA 


1020 


Db 


961 


1020 



Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I II I I I II I I I I I II I I I I I I I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 



Qy 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I I I I I I I II I I II I I I I I I I I I I I I I I I M M I I I I I I I I I I I I | | | | | | | I I | | | | I I 

Db 1081 AGAT GT C C ACCT G GCT GCAAAT GT GAAAAT T GT G GACT GG CT T C CT C AGAGT GAC C T C C T 1140 

Qy 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

M M M I II I I I I I I I I I I I I I I I I I I I I | I I I I M II M I I I I I I I I II I I I I I I I I I I 

Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

Qy 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | I I I | | M I I 

Db 12 01 CAT C CAGCAT GGT GT GC CCAT GGT GGGGAT C CCT CT CTTT GGAGAC CAGC CT GAAAACAT 12 60 

Qy 1261 GGT C C GAG T AGAAG C C AAAAAGT TTGGTGTTTC TAT T C AGT T AAAGAAG C T C AAG G C AG A 1320 

I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I | | | | M I I I I I I I 
Db 1261 GGT C C GAGT AGAAG C C AAAAAGT TT GGT GTT T CT AT T C AGT T AAAGAAGC T CAAG G C AGA 1320 

Qy 1321 GAC AT T G G CT C T TAAGAT GAAAC AAAT CAT G GAAGAC AAGAGAT AC AAGT C C G C GG C AGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I II I I I I I I I I 

Db 1321 GACATT GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT CC GCGGCAGT 138 0 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

IN I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I 

Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I | | | || | | 
Db 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 150 0 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I M I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 0 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I I I I I I I I I I I I I I I I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 



Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

M I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I | | | | | M I I II I I I I I I I I I I I I I I I 

Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 204 0 

M II I I I I I I I I I I I II I I I I I I I I | I M | | | | || | | | | | | | | | | | | | | | | | | | | | | | | | 

Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

Qy 2 041 T GCC CCT ACTAT CT AT CAT GGAATAAC AT C CAAGAAAGACACCTT GCAT ATT CT TT C AGT 2100 

M I I I II I I I I I I I I I I I I I I I I I I I I I M | | | | | | | | | | | | || | | | | | || | | | | | | | | | 
Db 2 041 T G C C C C T AC TAT CT AT CAT G GAAT AAC AT C C AAGAAAGAC AC C T T G CAT AT T C T T T C AG T 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I | | | | | | | | | | | 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

I I M I I I II I I I I I I I I I I I II I I II I || I I I | I I | II | | | | | | | | | | | | | | | | | | | | || 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

Qy 2221 C AGT GAG CTCCTTCTTGGCT GAG C AG G CAT G G AGAC T GT AG G T T T C C AG AT T T C C T G AAA 2280 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 C AGT GAG CT C CT T C T T GG CT GAG C AGG CAT GGAGACT GT AGGT T T C C AGAT T T C C T GAAA 2280 

Qy 22 81 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I 
Db 2281 AATAAAAGT T T AC AG C GT TAT CT C T C C C CAAC C T CACT AA 2320 
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PRIOR FILING DATE: 1998-10-27 
; PRIOR APPLICATION NUMBER: 60/106023 
; PRIOR FILING DATE: 1998-10-28 

Query Match 100.0%; Score 2320; DB 15; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 232 0; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

Qy 121 GCT CTCAGAGGCTGCCAAAATCCTGACAATAT CTACAGTAGGT GGAAGCCATTATCTACT 18 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 G CT CT C AGAG GC T G C CAAAAT C CT GACAAT AT CT AC AGT AG GT G GAAGC C AT TAT C TACT 180 

Qy 181 GAT G GAC CGGGTTTCT C AG AT T C T T C AAG AT C AC G GT C AT AAT GT C AC CAT GCT T AAC C A 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I II M I I I I I I I 

Db 181 GAT GGACC GGGT T T CT C AGAT T C TT CAAGAT C AC GGT CAT AAT GT C AC CAT G C T T AAC CA 2 40 

Qy 241 CAAAAGAG GT CCT T T TAT GC CAGAT T T T AAAAAG GAAGAAAAAT CAT AT CAAGT TAT C AG 300 

I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I 
Db 241 CAAAAGAG GT C CTT T T AT GCCAGAT T T T AAAAAG GAAGAAAAAT CAT AT CAAGT TAT C AG 3 00 

Qy 301 TT GGCTTGCACCTGAAGAT CAT CAAAGAGAATTTAAAAAGAGTTT T GAT T T CTTTCT GGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 301 TTGGCTTG C ACC T GAAGAT CAT CAAAGAGAAT TTAAAAAGAGT T T T GAT TTCTTTCTG GA 360 

Qy 361 AGAAAC T T TAG GT G G C AGAGGAAAAT T T G AAAACT T AT T AAAT GT T C T AGAAT ACT T G GC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AGAAAC T T TAG GT G G C AGAG GAAAAT T T GAAAAC T TAT T AAAT GT T C T AGAAT AC T T G G C 42 0 

Qy 421 GT T G CAGT GC AGT CAT T T T T T AAAT AGAAAGGATAT CAT GGAT T C CT TAAAGAAT GAGAA 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GTTGCAGT GCAGT CAT TTTTT AAAT AGAAAGGATAT CAT G GAT T CCT TAAAGAAT GAGAA 48 0 

Qy 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 
Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

Qy 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I 
Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

Qy 661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 



Qy 



721 GT CT AC AT T T GAC AACAC CAT CAAGGAACATT T CAC AGAAGGCT C T AGG C CAGT T T T GT C 780 



Db 721 GT CT ACAT T T GACAACAC CAT CAAG GAACAT T T CAC AGAAG GCT CT AGGC C AGTT T T GT C 78 0 

Qy 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I 
Db 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 AGT AC CAC AAGACTT GGAGAACT T CAT T G C CAAGT T T GG GGACT CT G GT TT T GT C CT T GT 960 

Qy 961 GAC CTTGGGCTC CAT G G T G AAC AC C T GT C AG AAT C C G G AAAT C T T CAAG GAG AT G AAC AA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 GAC CTTGGGCTC CAT GGT GAAC AC CT GT C AGAAT C C G GAAAT C T T C AAGGAGAT GAACAA 1020 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

Qy 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

Qy 1141 G G C T CAC C CAAG CAT CCGTCTGTTTGT CAC C CAC G G C G G G C AG AAT AG CAT AAT G GAG G C 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

Qy 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

Qy 1261 G GT C C GAGT AG AAGC C AAAAAGT T T G GT GT T T CT AT T CAGT T AAAGAAG CT CAAG G C AGA 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 

Qy 1321 GAC AT T GGCT C TTAAGAT GAAACAAAT C AT GGAAGAC AAGAGAT ACAAGT C C G CGGC AGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 GAC AT T GGCT CTT AAGAT GAAACAAAT CAT GGAAGACAAGAGAT ACAAGT C CGCGGC AGT 138 0 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

Qy 1441 GAT T GAC C AC GT C CT C C AGAC AG G G GG C G C GAC G C AC CT CAAG C C C TAT GT CT T T C AG C A 1500 

I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GAT T GAC CAC G T C C T C C AG AC AG G G G G C G C GAC G CAC C T CAAG C C C TAT GT C T T T C AG C A 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

I M I I I II II I I I I I I I II I I I I II I I I I I I I I I I I I I II I I I I I II I I I I I I II I I M I 



Db 15 61 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II i M 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 17 4 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

Qy 1741 T AT CT C CT GTTT T CTT GAAGAACAGGAAAAAT GGC CAAAAAT CAT C CTTT C C ACTT GCT A 1800 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M II I I I M I I 

Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I 
Db 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

Qy 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2040 

Qy 2041 T G C C C C T AC TAT CT AT CAT GG AAT AAC AT C C AAGAAAGAC AC C T T G CAT AT T CT T T C AGT 2100 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 T GC C CCTAC TAT CT AT CAT G GAAT AAC AT C CAAGAAAGACAC CTT GC AT AT T CT T T C AGT 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AGT T C AGGGC C GGACAC AG GCT CAC AGGT CT C C ACAT TGGGTCCCTGTCTCTGGTGCC C A 222 0 

Qy 2221 C AGT GAGCT CCTTCTTGGCT GAG C AG GC AT GGAGAC T GT AGGT T T C C AGAT T T C CT GAAA 2280 

I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

Qy 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 

I I I II I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 

RESULT 13 
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; Publication No. US20030082 627A1 

; GENERAL INFORMATION: 

; APPLICANT: Baker, Kevin P. 
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APPLICANT: Ferrara, Napoleone 
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FILE REFERENCE: P2830P1C13 

CURRENT APPLICATION NUMBER: US/ 1 0/006 , 1 17A 
CURRENT FILING DATE: 2002-03-19 
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PRIOR FILING DATE: 2001-07-09 
NUMBER OF SEQ ID NOS : 477 
SEQ ID NO 281 
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US-10-006-117A-281 

Query Match 100.0%; Score 2320; DB 15; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 232 0; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

Qy 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 61 AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 12 0 

Qy 121 GCT CT CAGAGGCT G CCAAAAT C CT GACAAT AT C TAC AGT AGGT GGAAGC CAT TAT CT AC T 180 

I I I I I I I I II II I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 1 I I 
Db 121 G C T C T C AGAG GC T G C C AAAAT C C T GACAAT AT CTAC AGT AG GT G GAAGC CAT TAT C TACT 18 0 

Qy 181 GAT GGAC CGGGTTT CT CAGAT T CTT CAAGAT CACGGT CAT AAT GT CAC CAT GCTT AAC CA 240 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GAT G G AC CGGGTTTCT CAGAT T C T T CAAGAT CAC G G T CAT AAT G T CAC CAT GCT T AAC C A 240 

Qy 241 CAAAAGAG GT C C T T T TAT G C CAGAT T T T AAAAAG GAAG AAAAAT CAT AT C AAGT TAT C AG 3 00 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 241 CAAAAGAG GT C CT T T TAT G C CAGAT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT C AG 300 

Qy 301 TTGGCTTG CAC C T GAAG AT CAT C AAAG AG AAT T T AAAAAG AGT T T T GAT TTCTTTCTG G A 360 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 

Qy 361 AG AAAC T T T AG GT G G C AGAGGAAAAT T T GAAAACT TAT T AAAT GT T C T AGAAT AC T T G G C 42 0 

I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I 



Db 361 AGAAACT T T AG GT G GC AGAG GAAAAT T T GAAAACT T AT T AAAT GT T C T AGAAT ACTT GG C 42 0 

Qy 421 GT T G C AG T G C AG T CAT T T T T T AAAT AG AAAGG AT AT CAT GGAT T C C T T AAAGAAT G AGAA 4 80 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 421 GT T GCAGT G C AGT CAT T T T TT AAAT AGAAAG GAT AT CAT GGAT T C C T T AAAGAAT GAGAA 4 80 

Qy 481 CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 

M I I I I M II I II II I I I I I II I I I I I I I I I I I II I I I I II I II 

Db 481 CTT C GAC AT G GT GAT AGT T GAAAC T T T T GACT ACT GTCCTTTCCT GAT T GC T GAGAAGCT 540 

Qy 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I II I I I I I I I I I I I II I I I II I I I | I I I 
Db 541 TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 60 0 

Qy 601 AAT C CCCT T GT CTT AT GT T CCAGT AT T C CGTT CCTT GCT GACT GAT CACAT GGACTT CT G 660 

M I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II | I M 

Db 601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGAT CACAT GGACTTCTG 660 

Qy 661 G G G C C GAG T G AAGAAT T T T C T GAT G T T C T T T AGT T T C T G C A G GAG G C AAC AG CACAT G C A 72 0 

I I I I I I I I I I I I II I I I II I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I 
Db 661 G G GC C GAGT GAAGAAT T T T CT GAT GT T CTT T AGT T T CT G C AG G AGG CAAC AG CACAT GCA 720 

Qy 721 GT CT AC AT T T GACAAC AC CAT CAAGGAACAT T T CAC AGAAGGCT C T AGG C C AGTT TT GT C 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 721 GT CTACATT T GACAACAC CAT CAAGGAACATTT CAC AGAAGGCT CTAGGC CAGT T TT GT C 78 0 

Qy 781 T CAT CTT CT ACT GAAAG C AGAGT T GT GGT T CAT T AACT C T GACT TT GC CT T T GAT TT T G C 840 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 8 40 

Qy 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 90 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

Qy 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I 
Db 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 9 60 

Qy 961 GAC CTTGGGCTC CAT G GT GAAC AC CT GT C AGAAT C C GGAAAT CTT C AAG GAGAT GAAC AA 1020 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I 
Db 961 GAC CTTGGGCTC CAT GGT GAAC AC CT GT CAGAAT C C G GAAAT CT T CAAGGAGAT GAACAA 1020 

Qy 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

Qy 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

Qy 1141 G G C T CAC C CAAGCAT CCGTCTGTTTGT CAC C C AC GGC GG G C AGAAT AGC AT AAT GGAG G C 12 00 

I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I II I I I II II I I I | I | I I I I I I 
Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 12 00 

Qy 12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I 

Db 12 01 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 



Qy 1261 G GT C C G AGT AG AAG C C AAAAAG TTTGGTGTTTC TAT T C AG T T AAA G AAG C T C AAG G C AG A 1320 

I M I I I I M I I I I i I I II I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I II I II I.I 
Db 1261 G GT C C GAGT AG AAG C C AAAAAGT T T G GT GT T T CT AT T C AGT T AAAGAAG C T C AAG GC AGA 1320 

Qy 1321 GAC AT T GGCT CTTAAGAT GAAACAAAT CAT GGAAGACAAGAGATACAAGT CC GCGGC AGT 1380 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | 
Db 1321 GACATTGGCTCTTAAGATGAAACAAAT CAT GGAAGACAAGAGATACAAGT CCGCGGC AGT 138 0 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 144 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I | | I | I M I II 

Db 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 15 61 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 174 0 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 TAT CTCCTGTTTTCTT GAAGAACAGGAAAAAT G GCCAAAAAT CAT C CT T T C C AC TT G CT A 1800 

Qy 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 19 8 0 

Qy 1981 C G AAT C AC AC C C T GAC T C T T C C AG C C T C CAT G T C C AG AC C TAG T C AG C C T C T C T C AC T C C 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

Qy 2 041 T G C C C C T AC TAT C TAT CAT G G AAT AAC AT C C AAGAAAG AC AC C T T G CAT AT T C T T T C AGT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2041 T G C C C CT ACT AT C T AT CAT G GAAT AAC AT C CAAGAAAGAC AC C T T GC AT AT T C T T T C AGT 2100 



Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I M I I I I I I M I I II I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

Qy 2221 C AGT GAGC T CCTTCTTGGCT GAGCAG G CAT G GAG ACT GT AGGT T T C C AG AT T T C CT G AAA 228 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I Mill 

Db 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

Qy 22 81 AATAAAAGT T T AC AGC GT T AT CT CT C C C CAAC C T C ACTAA 232 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 2320 
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; PRIOR APPLICATION NUMBER: 60/103449 

; PRIOR FILING DATE: 1998-10-06 

; PRIOR APPLICATION NUMBER: 60/103633 

PRIOR FILING DATE: 1998-10-08 

; PRIOR APPLICATION NUMBER: 60/103678 

; PRIOR FILING DATE: 1998-10-08 

; PRIOR APPLICATION NUMBER: 60/103679 

; PRIOR FILING DATE: 1998-10-08 

; PRIOR APPLICATION NUMBER: 60/103711 

; PRIOR FILING DATE: 1998-10-08 

; PRIOR APPLICATION NUMBER: 60/104257 

; PRIOR FILING DATE: 1998-10-14 

; PRIOR APPLICATION NUMBER: 60/104987 

; PRIOR FILING DATE: 1998-10-20 

; PRIOR APPLICATION NUMBER: 60/105000 

; PRIOR FILING DATE: 1998-10-20 

PRIOR APPLICATION NUMBER: 60/105002 

; PRIOR FILING DATE: 1998-10-20 

; PRIOR APPLICATION NUMBER: 60/105104 

; PRIOR FILING DATE: 1998-10-21 

; PRIOR APPLICATION NUMBER: 60/105169 

; PRIOR FILING DATE: 1998-10-22 

; PRIOR APPLICATION NUMBER: 60/105266 

; PRIOR FILING DATE: 1998-10-22 

; PRIOR APPLICATION NUMBER: 60/105693 

; PRIOR FILING DATE: 1998-10-26 

; PRIOR APPLICATION NUMBER: 60/105694 

; PRIOR FILING DATE: 1998-10-26 

; PRIOR APPLICATION NUMBER: 60/105807 

; PRIOR FILING DATE: 1998-10-27 

; PRIOR APPLICATION NUMBER: 60/105881 

; PRIOR FILING DATE: 1998-10-27 

; PRIOR APPLICATION NUMBER: 60/105882 

; PRIOR FILING DATE: 1998-10-27 

; PRIOR APPLICATION NUMBER: 60/106023 

; PRIOR FILING DATE: 1998-10-28 

Query Match 100.0%; Score 2320; DB 15; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 0 
Qy 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 

I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I | I I I II I I I I 

Db 1 AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 60 



Qy 


61 


AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 
1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 I I I M II 1 1 1 1 1 1 I | M | | | | | | | | | | | | 
AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 120 


Db 


61 


Qy 


121 


GCT C T C AG AG G CT G C C AAAAT C C T G AC AAT AT C T AC AGT AG G T G G AAG C CAT TAT C T AC T 18 0 
1 M 1 I 1 1 1 I 1 1 1 | | | 1 1 | | 1 1 1 1 1 1 1 1 1 1 1 1 1 | 1 1 | I 1 | | | | | N 1 1 1 1 1 1 t 1 1 1 1 | 1 I 1 
GCT CT C AGAG GCT GC C AAAAT C CT GACAAT AT C T AC AGT AGGT G GAAGC C AT TAT C T AC T 18 0 


Db 


121 


Qy 
Db 


181 
181 


GATGGACCGGGTTTCTCAGATTCTTCAAGATCACGGTCATAATGTCACCATGCTTAACCA 24 0 
I 1 1 1 M 1 I 1 1 1 II | I 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 I I I | | | | | | | | | | | | | | | | | | | | | | 
GAT GGAC CGGGTTTCT CAGAT T CTT CAAGAT C AC GGT CAT AAT GT C AC C AT GCTTAAC C A 2 4 0 


Qy 


241 


CAAAAGAG GT C C T T T TAT G C C AGAT T T T AAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 300 

1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I || I | | | | | | | | | | | | | | | 

CAAAAGAG GT C CT T T TAT G C CAGAT T T TAAAAAG GAAGAAAAAT CAT AT C AAGT TAT C AG 300 


Db 


241 


Qy 

Db 


301 
301 


TTGGCTTGCACCTGAAGATCATCAAAGAGAATTTAAAAAGAGTTTTGATTTCTTTCTGGA 360 

1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 I I I | I | I I 1 1 1 1 1 1 1 1 II 1 
TTGGCTTG C AC C T G AAG AT CAT C AAAG AGAAT T TAAAAAG AG T T T T GAT TTCTTTCTG G A 360 


Qy 


361 


AG AAAC T T T AG GT G G C AG AG G AAAAT T T G AAAAC T TAT T AAAT G T T C TAG AAT AC T T G G C 42 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I 1 1 1 1 
AGAAACT T TAG GT GGC AGAG GAAAAT T T GAAAAC T TAT TAAAT GT T CT AGAAT ACT T G GC 42 0 


Db 


361 


Qy 


421 


GT T GCAGT GCAGT CAT T T T TT AAAT AGAAAGGAT AT CAT GGAT T CC T T AAAGAAT GAGAA 48 0 

M 1 1 1 i i 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 

GT T G C AG T G C AG T CAT T T T T TAAAT AG AAAG GAT AT CAT G GAT T C C T T AAAG AAT GAGAA 4 8 0 


Db 


421 


Qy 


481 


CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 
CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 54 0 


Db 


481 


Qy 


541 


TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 

1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | | | | I | | || | | | | | | | | | | | | | | 

TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 600 


Db 


541 


Qy 


601 


AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 I 1 1 1 1 M M M 1 1 1 1 1 I 1 1 1 1 I 1 I I I I I 1 I | I | | 1 

AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 


Db 


601 


Qy 


661 


G G G C C G AGT GAAGAAT T T T C T GAT GT T C T T T AGT T T C T G C AGG AG GC AAC AG C AC AT G C A 72 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I I | | | | | | | | | 

G G GC CGAGT GAAGAAT T T T CT GAT GT T CT T T AGTT T CT G C AGGAG G C AAC AG C AC AT G C A 72 0 


Db 


661 


Qy 


721 


GT CT AC AT TT GACAAC AC CAT CAAGGAACAT T T C ACAGAAG G C T C T AGG C CAGT T T T GT C 7 8 0 

1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 I I I I I I I | | | || | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

GT C T AC AT T T GACAAC AC CAT C AAG GAAC AT T T C AC AG AAG G C T C TAG G C CAGT T T T G T C 7 8 0 


Db 


721 


Qy 


781 


TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 I 1 1 1 1 
TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 


Db 


781 


Qy 


841 


TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 9 00 

M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I M 1 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 I I | | | | | M 1 1 1 1 1 1 1 
TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 


Db 


841 


Qy 


901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 



Db 901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

Qy 961 GAC CTTGGGCTC CAT G G T GAAC AC C T GT C AGAAT C C G GAAAT C T T C AAG GAG AT G AAC AA 1020 

I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 961 GAC CTTGGGCTC CAT G GT GAAC AC C T GT C AGAAT C C G GAAAT CT T C AAG GAG AT G AAC AA 1020 

QY 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

M I I I II I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I | | | | | | | | M | | M I 
Db 1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 1080 

Qy 1081 AGAT GT C C ACC T GGC T GCAAAT GT GAAAAT T GT GGACT GG CT T C CT CAGAGT GAC C T C CT 114 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I | | | | || 
Db 1081 AGAT GT CCAC C T GGC T GCAAAT GT GAAAAT T GT GGACT GG CT T C CT CAGAGT GAC CT C CT 114 0 

Qy 1141 GG C T CAC C C AAGC AT CCGTCTGTTTGT CAC C CAC G GC GG GCAGAAT AG C AT AAT G G AG GC 12 00 

I I I I I I II I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I | | | | | 
Db 1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

Qy 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

Qy 1261 GGT C C GAGT AGAAGC CAAAAAGT TT GGT GT T T CT ATT CAGT T AAAGAAGC T C AAGGCAGA 1320 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 GGT C C GAGT AGAAG C CAAAAAGT TT GGT GT T T CTAT T CAGT T AAAGAAGC T C AAGGCAGA 1320 

Qy 1321 GACATTGGCT CTTAAGATGAAACAAAT CATGGAAGACAAGAGATACAAGT CCGCGGCAGT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I | | I || | | | | 
Db 1321 GACATTGGCT CTTAAGAT GAAACAAAT CATGGAAGACAAGAGATACAAGT CCGCGGCAGT 1380 

Qy 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I | 
Db 1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 

Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

Qy 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I 

Db 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 168 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I II I I I I I 

Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

Qy 1741 TAT CTCCTGTTTTCTT GAAG AAC AG G AAAAAT GGC C AAAAA.T CAT C C T T T C CAC T T G C T A 1800 
I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I II I II I I I I I I I I I 



Db 



1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 1800 



18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

I I M I I I I I I I II I I I I I I I I I I I I II II I I I II || | | M I I II I I I I I I I I I II 

Db 1801 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

Qy 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I II I I I I I I II I I I I I 
Db 1861 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 1920 

Qy 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I 

Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 1980 

QY 1981 C GAAT CAC AC C CT GAC T CT T C C AGC CT C CAT GT C CAGAC C T AGT CAGC CT C T C T CACT C C 2 04 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | M I I I I I I 
Db 198 1 CGAATCACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 204 0 

Qy 2 041 T GC C C CT AC T AT CT AT CAT GG AAT AAC AT C C AAGAAAGAC AC CT T GC AT AT T C T T T C AGT 210 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | M I I I I I I I I I I I I I I I I I I 

Db 2041 T GCC CCT AC T AT CT AT CAT GGAAT AACAT C CAAGAAAGAC AC CT T GC AT AT T C T TT C AGT 210 0 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | M I I I I I I I I I I 
Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I I I I I I I I I 
Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

Qy 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 22 8 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I | | | | | | | | | 
Db 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 2280 

Qy 2281 AAT AAAAGT T T ACAGC GT T AT CT CT C C C C AAC C T CAC T AA 232 0 

I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2281 AATAAAAGTTTACAGCGTTATCTCTCCCCAACCTCACTAA 232 0 



RESULT 15 

US-10-013-913A-281 

Sequence 281, Application US/10013913A 
Publication No. US200300834 62A1 
GENERAL INFORMATION: 



APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 



Baker, Kevin P. 
Botstein, David 
Desnoyers, Luc 
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Gao, Wei-Qiang 
Goddard, Audrey 
Godowski, Paul J. 
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; APPLICANT: Paoni, Nicholas F. 

; TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucl 
; TITLE OF INVENTION: Acids Encoding the Same 
; FILE REFERENCE: P2830P1C40 

; CURRENT APPLICATION NUMBER: US/ 1 0/ 013 , 913A 
; CURRENT FILING DATE: 2002-07-15 

; Prior Application removed - See File Wrapper or Palm 
; NUMBER OF SEQ ID NOS : 477 
; SEQ ID NO 281 
; LENGTH: 232 0 

TYPE : DNA 
; ORGANISM: Homo sapiens 
US-10-013-913A-281 



Query Match 100.0%; Score 2320; DB 15; Length 2320; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2320; Conservative 0; Mismatches 0; Indels 0; Gaps 



Qy 


1 


AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 

1 1 1 n 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 linn 

AGGGTCCCTTAGCCGGGCGCAGGGCGCGCAGCCCAGGCTGAGATCCGCGGCTTCCGTAGA 


60 


Db 


1 


60 


Qy 


61 


AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 

II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I I I I I I | | | | | | | | | M 1 1 

AGTGAGCATGGCTGGGCAGCGAGTGCTTCTTCTAGTGGGCTTCCTTCTCCCTGGGGTCCT 


120 


Db 


61 


120 


Qy 


121 


GCT CT CAGAGGCT GC CAAAAT C CT GACAATAT CT ACAGTAGGT GGAAGC CAT TAT CTACT 

1 1 N 1 1 1 1 1 1 1 1 1 1 1 1 I I | | | | | | | | | | || | | M 1 1 1 1 1 1 1 1 1 1 | | | | | | | | | | | | | | | | 

GCT C T CAGAGGCT GC CAAAAT C C T GACAATAT C T ACAGTAGGT GGAAGC CAT TAT CT AC T 


180 


Db 


121 


180 


Qy 


181 


GAT G GAC CGGGTTTCT C AG AT T C T T C AAGAT C AC GGT C AT AAT G T C AC CAT GCT T AAC C A 

N M 1 1 1 1 1 1 1 1 1 1 M 1 I I I | | | | | II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 I I | | | | | | 

GAT G GAC CGGGTTTCT C AG AT T C T T C AAGAT C AC GGT CAT AAT GT C AC CAT GCT T AAC C A 


240 


Db 


181 


240 


Qy 


241 


C AAAAG AG GT C C T T T TAT G C C AG AT T T T AAAAAG GAAGAAAAAT CAT AT C AAG T TAT C AG 

1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I I I I I | 1 1 1 1 1 1 1 1 1 1 I I I I I | | | 

C AAAAGAG GT C C T T T T AT GC C AG AT T T T AAAAAGGAAGAAAAAT CAT AT C AAGT TAT C AG 


300 


Db 


241 


300 


Qy 


301 


TT GGCTT GCAC CT GAAGAT CAT CAAAGAGAAT TTAAAAAGAGTTTTGATTT CTTT CT GGA 

1 1 N 1 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 I I I I I | | | M 1 1 1 1 1 1 1 1 1 I | | | | | | | | | 

TT GGCTT GCAC CT GAAGAT CAT CAAAGAGAAT TTAAAAAGAGTTTT GAT TT CTTT CT GGA 


360 


Db 


301 


360 


Qy 


361 


AGAAAC T T TAG GT G G C AGAGGAAAAT T T GAAAAC T TAT T AAAT GT T C T AGAAT AC T T G G C 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I II | | | | | 1 1 1 1 1 1 1 1 II 1 1 1 I I 1 1 1 1 1 1 1 1 1 

AGAAAC T T TAG GT G G C AGAG GAAAAT T T GAAAAC T TAT T AAAT GT T C T AGAAT AC T T G G C 


420 


Db 


361 


420 


Qy 


421 


GT T G C AG T G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT GAGAA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I | | | | | | | | | | | | | | | | | | | | | M | | | | | | | | | ,, | , j | 
GT T G C AGT G C AGT CAT T T T T T AAAT AGAAAG GAT AT CAT G GAT T C C T T AAAGAAT GAGAA 


480 


Db 


421 


480 


Qy 


481 


CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 

1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | 1 II II 1 1 1 1 1 1 1 1 1 II 1 1 

CTTCGACATGGTGATAGTTGAAACTTTTGACTACTGTCCTTTCCTGATTGCTGAGAAGCT 


540 


Db 


481 


540 


Qy 


541 


TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 

1 1 1 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TGGGAAGCCATTTGTGGCCATTCTTTCCACTTCATTCGGCTCTTTGGAATTTGGGCTACC 


600 


Db 


541 


600 



601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

I I I I I I I I I I I I I I I IJ I I I I I I I I I Ml Ml I I I I I I I I I I I | M I I I I I I I I I I I I I I 

601 AATCCCCTTGTCTTATGTTCCAGTATTCCGTTCCTTGCTGACTGATCACATGGACTTCTG 660 

661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

I I I I I I M I M I M I II I I M II M II I I II I M I I I I II I I I I II M I I I II II II I II 
661 GGGCCGAGTGAAGAATTTTCTGATGTTCTTTAGTTTCTGCAGGAGGCAACAGCACATGCA 72 0 

721 GT CT AC AT T T GACAAC AC CAT CAAGGAACAT T T C ACAGAAG GCT CT AGG C C AGT TT T GT C 78 0 

I I I M M I I I II II I I II I I I I II II I I II I II I I II I I I I I I I II II II I I I I I II II I 

721 GT CT AC AT T T GACAAC AC CAT CAAGGAACAT T T CACAGAAG GCT CT AG G C C AGT T T T GT C 78 0 
7 81 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

I M I I II I I I I I M M I I I I I I II I II I I II II I I I I II I I I I I II M I II M I I I M I I 

781 TCATCTTCTACTGAAAGCAGAGTTGTGGTTCATTAACTCTGACTTTGCCTTTGATTTTGC 84 0 

841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 9 00 

I M N II I M II II II I II I I II I M M I II II M II I I II II II I II I I I I I I I I I I I I 
841 TCGACCTCTGCTTCCCAACACTGTTTATGTTGGAGGCTTGATGGAAAAACCTATTAAACC 900 

9 01 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

M M II M I I I I I I I I I M I I II II I I I I I I I I I || M I I I I I II I I II I 

901 AGTACCACAAGACTTGGAGAACTTCATTGCCAAGTTTGGGGACTCTGGTTTTGTCCTTGT 960 

9 61 GAC CTTGGGCTC C AT GGT GAACAC C T GT C AGAAT C C GGAAAT CT T CAAG GAG AT GAAC AA 102 0 

I I II I I M I I I I I I I II I I I II I I I M II I II II II I I | | | M 

961 GAC CT T GG G CT C CAT GGT GAACAC CT GT C AGAAT C C GGAAAT CT T CAAG GAGAT GAACAA 1020 

1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 10 8 0 

I I I I I M II I I I I I I I I M I M I I I I I I I I II I I I I I I I I I I | | | || I I I I II II I || I I 
1021 TGCCTTTGCTCACCTACCCCAAGGGGTGATATGGAAGTGTCAGTGTTCTCATTGGCCCAA 108 0 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 114 0 

I I M I M I I I II I II I II I I I I I I II I I I I I I I I II I II I I M I I I I I I I II I 

1081 AGATGTCCACCTGGCTGCAAATGTGAAAATTGTGGACTGGCTTCCTCAGAGTGACCTCCT 1140 

1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 120 0 

M M M M I I II I I I M II I M I I I I I I I || I || | | M | | | | | | M I II I I I I I II II II 
1141 GGCTCACCCAAGCATCCGTCTGTTTGTCACCCACGGCGGGCAGAATAGCATAATGGAGGC 1200 

1201 CATCCAGCATGGTGTGCCCATGGTGGGGATCCCTCTCTTTGGAGACCAGCCTGAAAACAT 1260 

M I I II II I I II I I I I I I II I I I I I I I | || | | | | | | | | | | | | | M I II I II I II I 

1201 CAT C CAGCAT GGT GT GC C CAT GGT GGGGAT CC CT CT CTTT GGAGAC CAGC CT GAAAACAT 1260 

1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 

I I I I I I I I I I I I I I I I I I I I I II I I I II I I II I I I I I I II II 

1261 GGTCCGAGTAGAAGCCAAAAAGTTTGGTGTTTCTATTCAGTTAAAGAAGCTCAAGGCAGA 1320 

1321 GAC AT T G GC T C T T AAGAT G AAAC AAAT CAT G GAAGACAAGAGAT ACAAGT C C G C G G C AGT 1380 

I I I I I M I I I I I I I I I I I I I I I I M I I I II I II I I I I I I || I | | M I I I I II I I I I II II 
1321 GAC AT T G GC T C T T AAGAT GAAACAAAT CAT G GAAGACAAGAGAT ACAAGT C C G C G G C AGT 1380 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 14 4 0 

I I I I I I I I I I I I I I I I I I I I | | | | | M I I II I II I || || || I II II I I I I I I I II 

1381 GGCTGCCAGTGTCATCCTGCGCTCCCACCCGCTCAGCCCCACACAGCGGCTGGTGGGCTG 1440 



Qy 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

I I I I I I I M I I I I I I I I I I I I I I I I I II I I I | | M I I I I I I I I I I | | | | | | | | | | | | | | | 
Db 1441 GATTGACCACGTCCTCCAGACAGGGGGCGCGACGCACCTCAAGCCCTATGTCTTTCAGCA 1500 

Qy 15 01 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 15 60 

I I M M I I I I I I I I I I I M I I I II I I I I I I I || I I | | || | | | | | | M | | | | | | | | | || | | 
Db 1501 GCCCTGGCATGAGCAGTACCTGTTCGACGTTTTTGTGTTTCTGCTGGGGCTCACTCTGGG 1560 

Qy 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 1620 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I | | | | | | | | | | | || | | | | | | | | | | | | | 

D t> 1561 GACTCTATGGCTTTGTGGGAAGCTGCTGGGCATGGCTGTCTGGTGGCTGCGTGGGGCCAG 162 0 

Qy 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1621 AAAGGTGAAGGAGACATAAGGCCAGGTGCAGCCTTGGCGGGGTCTGTTTGGTGGGCGATG 1680 

Qy 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TCACCATTTCTAGGGAGCTTCCCACTAGTTCTGGCAGCCCCATTCTCTAGTCCTTCTAGT 1740 

Qy 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 0 0 

I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I | | | | | | | || | | || 
Db 1741 TATCTCCTGTTTTCTTGAAGAACAGGAAAAATGGCCAAAAATCATCCTTTCCACTTGCTA 18 00 

Qy 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 1860 

I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 18 01 ATTTTGCTACAAATTCATCCTTACTAGCTCCTGCCTGCTAGCAGAAATCTTTCCAGTCCT 18 60 

Qy 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 18 61 CTTGTCCTCCTTTGTTTGCCATCAGCAAGGGCTATGCTGTGATTCTGTCTCTGAGTGACT 192 0 

Qy 1921 T GGAC CACT GAC C CT CAGATTT C CAGC CTTAAAAT C CAC CTT C CTT CT CAT GC GCCT CT C 198 0 

I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I | | | | | | | | | | 
Db 1921 TGGACCACTGACCCTCAGATTTCCAGCCTTAAAATCCACCTTCCTTCTCATGCGCCTCTC 198 0 

Qy 1981 CGAAT CACAC C C T GACT CT T C C AG C CT C CAT GT C CAGAC CT AGT C AGC C T C T CT C ACT C C 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 19 81 CGAAT CACACCCTGACTCTTCCAGCCTCCATGTCCAGACCTAGTCAGCCTCTCTCACTCC 2 04 0 

Qy 2041 T G C C C C T AC TAT CT AT CAT G GAAT AAC AT C C AAGAAAGAC AC C T T G CAT AT T C T T T C AG T 210 0 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2041 T G C C C CT AC TAT C TAT CAT G GAAT AAC AT C C AAGAAAGAC AC CTT GC AT AT T C T T T C AG T 2100 

Qy 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

I I I I M I I I I I I I I I I I I I I II I II I I I I I II I I I I I I I I I I I I I I II I I | I I | | | | | | | 

Db 2101 TTCTGTTTTGTTCTCCCACATATTCTCTTCAATGCTCAGGAAGCCTGCCCTGTGCTTGAG 2160 

Qy 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 222 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 2161 AGTTCAGGGCCGGACACAGGCTCACAGGTCTCCACATTGGGTCCCTGTCTCTGGTGCCCA 2220 

QY 2221 CAGTGAGCTCCTTCTTGGCTGAGCAGGCATGGAGACTGTAGGTTTCCAGATTTCCTGAAA 228 0 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 C AG T GAG CTCCTTCTTGGCT GAG C AG G CAT G GAG AC T GT AG G T T T C C AG AT T T C C T G AAA 228 0 

Qy 2281 AAT AAAAGT T T ACAG C GT T AT CT C T C C C CAAC C T C ACT AA 2320 



Db 22 81 AAT AAAAGT T T AC AG C GT TAT C T CT C C C C AAC C T C AC T AA 2320 
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